Base n encoding là gì?
- ★
- ★
- ★
- ★
- ★
Trước khi đi sâu vào base n encoding, trước tiên chúng ta hãy thử hiểu cơ số (base) ở đây là gì?
Trong hệ thống số (number system), cơ số (base hoặc radix) là số chữ số hoặc kết hợp các chữ số và chữ cái được sử dụng để biểu diễn các số. Cơ số (base) phổ biến nhất mà chúng ta sử dụng trong cuộc sống của mình là 10 hoặc hệ thập phân vì ở đây chúng ta sử dụng 10 chữ số duy nhất, tức là từ 0 đến 9 để đại diện cho tất cả các số. Một hệ thống được sử dụng rộng rãi khác là hệ nhị phân, tức là cơ số là 2. Nó sử dụng 0 và 1, tức là 2 chữ số để thể hiện tất cả các số.
Đối với binary encoding, cơ số (base) là 2 có nghĩa là nó chuyển đổi các giá trị số của một lớp (category) thành dạng nhị phân tương ứng của nó. Nếu bạn muốn thay đổi cơ số của lược đồ encoding , bạn có thể sử dụng base n encoding. Trong trường hợp khi lớp (category) nhiều hơn và binary encoding không thể xử lý chiều (dimensionality) thì chúng ta có thể sử dụng cơ số lớn hơn như 4 hoặc 8.
So với binary encoding, kỹ thuật base n encoding làm giảm hơn số lượng các đặc trưng cần thiết để biểu diễn dữ liệu một cách hiệu quả và cải thiện việc sử dụng bộ nhớ. Cơ số mặc định cho base n là 2 tương đương với binary encoding.
Learning English Everyday