Database normalization là gì?

Phrase Database
Chuẩn hóa cơ sở dữ liệu

Chuẩn hóa cơ sở dữ liệu (database normalization) là một kỹ thuật sắp xếp dữ liệu trong cơ sở dữ liệu (database). Chuẩn hóa (normalization) là một cách tiếp cận có hệ thống của việc phân tách các bảng (table) để loại bỏ dư thừa dữ liệu (lặp lại) và các đặc điểm không mong muốn như insertion anomaly, updation anomaly và deletion anomaly. Đây là một quá trình nhiều bước đưa dữ liệu vào dạng bảng, loại bỏ dữ liệu trùng lặp khỏi các bảng.

Chuẩn hóa được sử dụng chủ yếu cho hai mục đích

  • Loại bỏ dữ liệu thừa (vô ích).
  • Đảm bảo các phụ thuộc dữ liệu có ý nghĩa tức là dữ liệu được lưu trữ một cách hợp lý.

Để xem vấn đề khi không chuẩn hóa hãy xem ví dụ sau

ROLL NOR NAME BRANCH HOD PHONE NO
201 John Computer Science Mr. X 53328
202 Lan Computer Science Mr. X 53328
203 Mai Computer Science Mr. X 53328

Trong bảng trên, chúng ta có dữ liệu của 3 sinh viên. Như chúng ta thấy, dữ liệu cho các trường branch, hod (Head of Department) và phone no được lặp lại cho các sinh viên học cùng ngành trong trường đại học, đây là dư thừa dữ liệu (data redundancy).

Learning English Everyday