Dirty data là gì?

Noun None
Dữ liệu bẩn

Dữ liệu bẩn (dirty data) là dữ liệu không chính xác, không đầy đủ (incomplete data) hoặc không nhất quán (inconsistent), đặc biệt là trong hệ thống máy tính hoặc cơ sở dữ liệu (database).

Dữ liệu bẩn (dirty data) có thể chứa các lỗi như lỗi chính tả hoặc dấu chấm câu, dữ liệu không chính xác được liên kết với một trường (field), dữ liệu không đầy đủ (incomplete data) hoặc lỗi thời hoặc thậm chí dữ liệu đã được sao chép trong cơ sở dữ liệu. Chúng có thể được làm sạch (clean) thông qua một quá trình được gọi là làm sạch dữ liệu (data cleaning).

Learning English Everyday