Baseline là gì?

Noun AI
Đường cơ sở

Lớp (class) OneHotEncoder có thể được sử dụng để triển khai (implement) dummy variable encoding cũng như one hot encoding. Đối số (argument) "drop" có thể được thiết lập để cho biết lớp (category) nào sẽ được gán tất cả các giá trị 0 được gọi là đường cơ sở (baseline). Chúng ta có thể đặt giá trị này thành "first" để lớp đầu tiên được sử dụng.


from numpy import asarray
from sklearn.preprocessing import OneHotEncoder
# define data
data = asarray([['red'], ['green'], ['blue']])
print(data)
# define one hot encoding
encoder = OneHotEncoder(drop='first', sparse=False)
# transform data
onehot = encoder.fit_transform(data)
print(onehot)

Đoạn code trên sẽ liệt kê ba hàng cho biến phân loại (categorical variable), sau đó dummy variable encoding, cho thấy rằng "green" được "mã hóa" (encode) là [1, 0], "red" được mã hóa là [0, 1] và "blue" được mã hóa là [0, 0].

Output:


[['red']
 ['green']
 ['blue']]
[[0. 1.]
 [1. 0.]
 [0. 0.]]

Learning English Everyday