Feature engineering là gì?
- ★
- ★
- ★
- ★
- ★
Feature engineering là quá trình xác định đặc trưng (feature) nào có thể hữu ích trong việc huấn luyện mô hình (model) và sau đó chuyển dữ liệu thô (raw data) thành các đặc trưng (feature) đã xác định. Mục đích của feature engineering là chuẩn bị một tập dữ liệu đầu vào phù hợp nhất với thuật toán học máy (machine learning algorithm) cũng như để nâng cao hiệu suất (performance) của các mô hình học máy.
Giả sử, chúng ta được cung cấp một dữ liệu "ngày giờ chuyến bay và tình trạng của chuyến bay". Sau đó, với dữ liệu ngày-giờ, chúng ta phải dự đoán tình trạng của chuyến bay.
Vì tình trạng của chuyến bay phụ thuộc vào giờ trong ngày, không phụ thuộc vào ngày-giờ. Chúng ta sẽ tạo đặc trưng mới là "Hour_Of_Day". Sử dụng đặc trưng "Hour_Of_Day", máy sẽ học tốt hơn vì đặc trưng này liên quan trực tiếp đến tình trạng của chuyến bay.
Ở đây, tạo đặc trưng mới "Hour_Of_Day" là feature engineering.
Learning English Everyday