Unstructured text là gì?

Noun None
Văn bản phi cấu trúc

Văn bản phi cấu trúc (unstructured text) là nội dung được viết thiếu siêu dữ liệu (metadata) và không thể dễ dàng lập chỉ mục (index) hoặc ánh xạ (mapp) vào các trường (field) của cơ sở dữ liệu. Nó thường là thông tin do người dùng tạo ra như email hoặc tin nhắn tức thì (instant message), tài liệu (document) hoặc các bài đăng (post) trên mạng xã hội (social media). Văn bản phi cấu trúc (unstructured text) là nguồn thông tin quan trọng cho các doanh nghiệp, viện nghiên cứu và các cơ quan giám sát. Các doanh nghiệp thường khai thác văn bản phi cấu trúc (unstructured text) để lấy dữ liệu nhằm nâng cao chiến lược kinh doanh thông minh và đạt được lợi thế cạnh tranh trên thị trường. Văn bản phi cấu trúc (unstructured text) được thu thập từ các hoạt động truyền thông xã hội đóng một vai trò quan trọng trong phân tích dự đoán cho doanh nghiệp vì nó là nguồn chính để phân tích tình cảm nhằm xác định thái độ chung của người tiêu dùng đối với một thương hiệu hoặc ý tưởng.

Learning English Everyday