Content-based classification là gì?

Noun AI
Phân loại dựa trên nội dung

Hiểu phân loại tài liệu (document classification) trước khi xem thuật ngữ này. Phân loại dựa trên nội dung (content-based classification) là phân loại (classification) trong đó trọng số (weight) cho các chủ đề (subject) cụ thể trong một tài liệu (document) xác định lớp (class) mà tài liệu được chỉ định. Ví dụ một quy tắc phổ biến để phân loại trong các thư viện, đó là ít nhất 20% nội dung của một cuốn sách phải nói về lớp (class) mà cuốn sách đó được chỉ định. Trong phân loại tự động, nó có thể là số lần các từ đã cho xuất hiện trong một tài liệu.

Learning English Everyday