Agglomerative clustering là gì?

Noun AI
hierarchical agglomerative clustering

Agglomerative clustering còn được gọi là phương pháp tiếp cận từ dưới lên (bottom-up approach) hoặc hierarchical agglomerative clustering (HAC) là một cách tiếp cận của phân cụm phân cấp (hierarchical cluster). Agglomerative clustering ban đầu coi mỗi điểm dữ liệu (data point) như một cụm (cluster) và sau đó kết hợp hai cụm gần nhất thành một cụm duy nhất cho đến khi tất cả các cụm đã được hợp nhất thành một cụm duy nhất chứa tất cả dữ liệu.

given a dataset (d1, d2, d3, ....dN) of size N
# compute the distance matrix
for i=1 to N:
   # as the distance matrix is symmetric about 
   # the primary diagonal so we compute only lower 
   # part of the primary diagonal 
   for j=1 to i:
      dis_mat[i][j] = distance[di, dj] 
each data point is a singleton cluster
repeat
   merge the two cluster having minimum distance
   update the distance matrix
until only a single cluster remains
Learning English Everyday