Dummy coding là gì?

Noun AI

Dummy coding tương tự như one-hot encoding. Phương pháp mã hóa (encoding) dữ liệu phân loại (categorical data) này biến biến phân loại (categorical variable) thành một tập hợp các biến nhị phân (binary variable hay dummy variable) . Trong trường hợp one-hot encoding, đối với N lớp (category) trong một biến, nó sử dụng N biến nhị phân. Dummy encoding là một cải tiến nhỏ so với one-hot-encoding. Dummy encoding sử dụng N-1 đặc trưng (feature) để đại diện cho N nhãn (label) / lớp.

Để hiểu rõ hơn điều này, chúng ta hãy xem hình ảnh bên dưới. Ở đây chúng tôi đang mã hóa cùng một dữ liệu bằng cách sử dụng cả kỹ thuật one-hot encoding và dummy encoding. One-hot encoding sử dụng 3 biến để đại diện cho dữ liệu và dummy encoding sử dụng 2 biến để đại diện cho dữ liệu.

Learning English Everyday