Binary encoding là gì?

Noun AI

Binary encoding là sự kết hợp của hash encoding và one-hot encoding. Trong lược đồ encoding này, đặc trưng phân loại (categorical feature) lần đầu tiên được chuyển đổi thành số bằng cách sử dụng ordinal encoding. Sau đó, các con số được biến đổi thành số nhị phân. Sau khi giá trị nhị phân đó được chia thành các cột (column) khác nhau Binary encoding hoạt động thực sự tốt khi có số lượng lớp (category) cao. Ví dụ: các thành phố ở một quốc gia nơi một công ty cung cấp sản phẩm của mình. Binary encoding là một lược đồ encoding hiệu quả về bộ nhớ vì nó sử dụng ít đặc trưng (feature) hơn so với one-hot encoding. Hơn nữa, nó làm giảm curse of dimensionality đối với dữ liệu có cardinality cao.

Learning English Everyday