K means n hac n dbscan
K means
- 目标:自动分 k 类
- 步骤
- 开始随机选 k 个作为 k 类中心点
- repeat:
- 新点添加到最近中心点
- 更新类别平均中心点
HAC
最小生成簇,在 $n^2$ 个边中选择 distance 最小的边合并。
GPT:
-
Complete Linkage(最大链接):
- 计算两个簇之间的距离时,使用两个簇中所有点之间的最大距离。
- 结果是形成紧密的、相对球形的簇。
- 对噪声和离群点较为敏感。
-
Single Linkage(最小链接):
-
计算两个簇之间的距离时,使用两个簇中所有点之间的最小距离。
- 可能导致“链式效应”,形成长而稀疏的簇。
- 对噪声和离群点较不敏感。
DBSCAN 算法
“密度相连”的点(由某个高密度的点可到达它们) $<==>$ 两点在一个聚类簇
到达者,沿途必须是高密度点