Big data là gì?

Phrase None
big data
Dữ liệu lớn

Cụm từ "dữ liệu lớn" thường được sử dụng trong các cơ sở doanh nghiệp để mô tả một lượng lớn dữ liệu. Nó không đề cập đến một lượng dữ liệu cụ thể, mà mô tả một tập dữ liệu không thể được lưu trữ hoặc xử lý bằng phần mềm cơ sở dữ liệu truyền thống.

Ví dụ về dữ liệu lớn bao gồm chỉ mục tìm kiếm của Google, cơ sở dữ liệu hồ sơ người dùng (user profile) Facebook và danh sách sản phẩm của Amazon.com. Các bộ sưu tập dữ liệu này (hoặc "bộ dữ liệu") quá lớn nên dữ liệu không thể được lưu trữ trong một cơ sở dữ liệu điển hình, hoặc thậm chí một máy tính duy nhất. Thay vào đó, dữ liệu phải được lưu trữ và xử lý bằng hệ quản trị cơ sở dữ liệu (database management system) có khả năng mở rộng cao. Dữ liệu lớn thường được phân phối trên nhiều thiết bị lưu trữ (storage device), đôi khi ở một số vị trí khác nhau.

Nhiều hệ quản trị cơ sở dữ liệu truyền thống có giới hạn về lượng dữ liệu mà chúng có thể lưu trữ. Ví dụ: cơ sở dữ liệu Access 2010 chỉ có thể chứa hai gigabyte dữ liệu, điều này làm cho việc lưu trữ một vài petabyte hoặc exabyte dữ liệu là không khả thi. Ngay cả khi một DBMS có thể lưu trữ một lượng lớn dữ liệu, nó có thể hoạt động không hiệu quả nếu tạo quá nhiều bảng (table) hoặc bản ghi (record), điều này có thể dẫn đến hiệu suất chậm. Các giải pháp dữ liệu lớn giải quyết những vấn đề này bằng cách cung cấp các hệ thống lưu trữ có khả năng mở rộng và đáp ứng cao.

Learning English Everyday