Imputation là gì?

Noun AI

Trong thống kê, imputation là quá trình thay thế dữ liệu bị khuyết (missing data) bằng các giá trị được thay thế. Về cơ bản, nó có nghĩa là thay thế giá trị bị khuyết bằng một giá trị khác. Giá trị khác có thể là giá trị trung bình (mean), giá trị trung vị (median) hoặc giá trị xuất hiện thường xuyên nhất (giá trị yếu vị (mode)). Nói chung, đối với các đặc trưng số (numerical feature), chúng ta sử dụng giá trị trung bình và giá trị trung vị để thay thế chúng, trong trường hợp đặc trưng phân loại (categorical feature), chúng ta có xu hướng sử dụng giá trị yếu vị.

Learning English Everyday