Database normalization là gì?
- ★
- ★
- ★
- ★
- ★
Chuẩn hóa cơ sở dữ liệu (database normalization) là một kỹ thuật sắp xếp dữ liệu trong cơ sở dữ liệu (database). Chuẩn hóa (normalization) là một cách tiếp cận có hệ thống của việc phân tách các bảng (table) để loại bỏ dư thừa dữ liệu (lặp lại) và các đặc điểm không mong muốn như insertion anomaly, updation anomaly và deletion anomaly. Đây là một quá trình nhiều bước đưa dữ liệu vào dạng bảng, loại bỏ dữ liệu trùng lặp khỏi các bảng.
Chuẩn hóa được sử dụng chủ yếu cho hai mục đích
- Loại bỏ dữ liệu thừa (vô ích).
- Đảm bảo các phụ thuộc dữ liệu có ý nghĩa tức là dữ liệu được lưu trữ một cách hợp lý.
Để xem vấn đề khi không chuẩn hóa hãy xem ví dụ sau
ROLL NOR | NAME | BRANCH | HOD | PHONE NO |
---|---|---|---|---|
201 | John | Computer Science | Mr. X | 53328 |
202 | Lan | Computer Science | Mr. X | 53328 |
203 | Mai | Computer Science | Mr. X | 53328 |
Trong bảng trên, chúng ta có dữ liệu của 3 sinh viên. Như chúng ta thấy, dữ liệu cho các trường branch, hod (Head of Department) và phone no được lặp lại cho các sinh viên học cùng ngành trong trường đại học, đây là dư thừa dữ liệu (data redundancy).
Learning English Everyday