Dendrogram là gì?

Noun AI

Dendrogram là một biểu đồ (diagram) thể hiện mối quan hệ thứ bậc giữa các quan sát (observation). Nó thường được tạo ra dưới dạng đầu ra từ phân cụm phân cấp (hierarchical clustering). Công dụng chính của dendrogram là tìm ra cách tốt nhất để phân bổ các quan sát vào các cụm (cluster). Dendrogram bên dưới cho thấy phân cụm phân cấp của sáu quan sát được hiển thị trên biểu đồ phân tán (scatterplot) ở bên trái.

Chìa khóa để hiểu một biểu đồ dendrogram là tập trung vào độ cao mà tại đó hai quan sát bất kỳ được nối với nhau. Trong ví dụ trên, chúng ta có thể thấy rằng E và F giống nhau nhất, vì chiều cao của liên kết nối chúng với nhau là nhỏ nhất. Hai quan sát gần giống nhau nhất tiếp theo là A và B.

Trong biểu đồ dendrogram ở trên, chiều cao của dendrogram cho biết thứ tự mà các cụm (cluster) được nối với nhau. Một biểu đồ dendrogram nhiều thông tin hơn có thể được tạo ra trong đó các chiều cao phản ánh khoảng cách (distance) giữa các cụm như được hiển thị bên dưới. Trong trường hợp này, biểu đồ dendrogram cho chúng ta thấy rằng sự khác biệt lớn giữa các cụm là giữa cụm A và B so với cụm C, D, E và F.

Các quan sát (observation) được phân bổ cho các cụm bằng cách vẽ một đường ngang qua biểu đồ dendrogram. Các quan sát được nối với nhau bên dưới đường này thành từng cụm. Trong ví dụ dưới đây, chúng ta có hai cụm. Một cụm kết hợp A và B và cụm thứ hai kết hợp C, D, E và F.

Learning English Everyday