Outlier là gì?

Noun AI Machine learning
noise
Điểm dị biệt, dữ liệu ngoại lai

Điểm dị biệt (outlier) trong học máy (machine learning) là một điểm dữ liệu (data point) khác biệt đáng kể so với phần còn lại. Chúng đại diện cho các sai số (error) trong đo lường (measurement), thu thập dữ liệu không tốt. Trong các mô hình (model) học có giám sát, các điểm dị biệt (outlier) có thể đánh lừa quá trình huấn luyện dẫn (training) đến kéo dài thời gian huấn luyện hoặc dẫn đến việc phát triển các mô hình kém chính xác hơn. Ví dụ một quy trình đo lường luôn tạo ra các chỉ số từ 1 đến 10, nhưng trong một số trường hợp hiếm hoi, chúng ta nhận được các số đo lớn hơn 20. Các số lớn hơn 20 là điểm dị biệt.

Learning English Everyday