Classification là gì?
- ★
- ★
- ★
- ★
- ★
Phân loại (classification) trong học máy (machine learning) là quá trình dự đoán nhãn (label) của các điểm dữ liệu (data point) đã cho. Mô hình phân loại xấp xỉ một hàm ánh xạ (f) từ các biến đầu vào (X) đến các biến đầu ra rời rạc (y).
Ví dụ: trong phát hiện thư rác trong các nhà cung cấp dịch vụ email có thể được xác định là một vấn đề phân loại. Đây là phân loại nhị phân (binary classification) vì chỉ có 2 nhãn là thư rác và không phải thư rác. Trình phân loại (classifier) sử dụng tập dữ liệu huấn luyện (traning data) để hiểu các biến đầu vào đã cho liên quan như thế nào với nhãn. Trong trường hợp này, các email spam và không phải spam đã biết phải được sử dụng làm tập dữ liệu huấn luyện. Khi trình phân loại được huấn luyện (train) chính xác, nó có thể được sử dụng để phát hiện một email không xác định.
Learning English Everyday