Skip to content

K means n hac n dbscan

K means

  • 目标:自动分 k 类
  • 步骤
    • 开始随机选 k 个作为 k 类中心点
    • repeat:
      • 新点添加到最近中心点
      • 更新类别平均中心点

HAC

最小生成簇,在 $n^2$ 个边中选择 distance 最小的边合并。

GPT:

  1. Complete Linkage(最大链接):

    • 计算两个簇之间的距离时,使用两个簇中所有点之间的最大距离。
    • 结果是形成紧密的、相对球形的簇。
    • 对噪声和离群点较为敏感。
    • Single Linkage(最小链接):

    • 计算两个簇之间的距离时,使用两个簇中所有点之间的最小距离。

    • 可能导致“链式效应”,形成长而稀疏的簇。
    • 对噪声和离群点较不敏感。

DBSCAN 算法

“密度相连”的点(由某个高密度的点可到达它们) $<==>$ 两点在一个聚类簇

到达者,沿途必须是高密度点

see: https://cloud.tencent.com/developer/article/1664886