Random sampling là gì?

Noun AI

Trong học máy (machine learning ) nếu chúng t thực hiện lấy mẫu ngẫu nhiên (random sampling) để chia tập dữ liệu (datasaet) thành tập dữ liệu huấn luyện (training set) và tập thử nghiệm (test set) theo tỷ lệ 8: 2 tương ứng, thì chúng ta có thể nhận được tất cả lớp negative (negative class) trong tập dữ liệu huấn luyện tức là 80 mẫu dữ liệu (sample) trong tập dữ liệu huấn luyện và tất cả 20 mẫu dữ liệu lớp positive (positive class) trong tập thử ngh. Bây giờ nếu chúng ta huấn luyện (train) mô hình (model) của mình trên tập dữ liệu huấn luyện và kiểm tra (test) mô hình của chúng ta trên tập thử nghiệm, Khi đó rõ ràng là chúng ta sẽ nhận được độ chính xác không tốt.

Learning English Everyday