Multicollinearity là gì?

Noun AI
Đa cộng tuyến

Đa cộng tuyến (multicollinearity ) xảy ra khi hai hoặc nhiều biến độc lập (independent variable) có tương quan (correlation) cao với nhau trong mô hình hồi quy (regression model).

Điều này có nghĩa là một biến độc lập có thể được dự đoán từ một biến độc lập khác trong mô hình hồi quy. Ví dụ: chiều cao và cân nặng, thu nhập hộ gia đình và lượng nước tiêu thụ, quãng đường đi được và giá của một chiếc ô tô, thời gian học tập và thời gian giải trí, v.v.

Chúng ta lấy một ví dụ đơn giản từ cuộc sống hàng ngày của chúng ta để giải thích điều này. John thích xem tivi trong khi ăn khoai tây chiên. Anh ấy càng xem nhiều tivi, anh ấy càng ăn nhiều khoai tây chiên và anh ấy càng hạnh phúc!

Bây giờ, nếu chúng ta có thể định lượng mức độ hạnh phúc và đo lường mức độ hạnh phúc của John trong khi anh ấy đang thực hiện hoạt động yêu thích của mình, thì bạn nghĩ điều nào sẽ có tác động lớn hơn đến hạnh phúc của anh ấy? Ăn khoai tây hoặc xem truyền hình? Điều đó rất khó xác định vì thời điểm chúng ta cố gắng đo lường mức độ hạnh phúc của John khi ăn khoai tây chiên, anh ấy bắt đầu xem tivi. Và thời điểm chúng tôi cố gắng đo mức độ hạnh phúc của anh ấy khi xem tivi, anh ấy bắt đầu ăn khoai tây chiên.

Ăn khoai tây chiên và xem truyền hình có mối tương quan rất lớn trong trường hợp của John và chúng ta không thể xác định được tác động của các hoạt động riêng lẻ đối với hạnh phúc của anh ấy. Đây là vấn đề đa cộng tuyến (multicollinearity).

Learning English Everyday