Classification threshold là gì?

Noun AI Machine learning
decision threshold
Ngưỡng phân loại

Mô hình hồi quy logistic (logistic regression) trả về 0,9995 cho một email cụ thể dự đoán rằng nó rất có thể là thư rác. Ngược lại, một email khác có điểm (score) dự đoán là 0,0003 trên cùng một mô hình hồi quy logistic đó rất có thể không phải là thư rác. Tuy nhiên, đối với một email có điểm dự đoán là 0,6 thì sao? Để ánh xạ giá trị hồi quy logistic thành một lớp nhị phân (binary category), bạn phải xác định ngưỡng phân loại (classification threshold). Giá trị trên ngưỡng (threshold) đó cho biết thư rác, giá trị bên dưới cho biết không phải là thư rác. Thật hấp dẫn khi giả định rằng ngưỡng phân loại phải luôn là 0,5, nhưng các ngưỡng phụ thuộc vào bài toán và do đó là các giá trị mà bạn phải điều chỉnh.

Learning English Everyday