DBSCAN密度聚类
DBSCAN算法是一种基于密度的聚类算法:
- 聚类的时候不需要预先指定簇的个数
- 最终的簇个数不定
DBSCAN算法将数据点分为三类:
- 核心点: 在半径Eps内含有超过MinPts数目的点。
- 边界点: 在半径Eps内点的数量小于MinPts, 但是落在核心点的领域内。
-
噪音点: 既不是核心点也不是边界点的点。
DBSCAN.png
DBSCAN算法流程:
- 将所有点标记为核心点,边界点或噪音点;
- 删除噪声点;
- 为距离在Eps之内的所有核心点之间赋予一条边;
- 每组连通的核心点形成一个簇
- 将每个边界点指派到一个与之关联的核心点的簇中(哪一个核心点的半径范围之内)
网友评论