算法笔记（12）DBSCAN算法及Python代码实现

作者: 编程研究坊 | 来源:发表于2022-05-18 14:59 被阅读0次

算法笔记（12）DBSCAN算法及Python代码实现
操作说明
13 聚类算法 - 谱聚类
【挖掘模型】：Python-DBSCAN算法
SMO算法实现
Python实现梯度下降算法求多元线性回归(一)
基于 SparkGraphx 实现适用于位置信息的DBScan聚
基于spark的dbscan算法实现
聚类算法
K近邻(KNN)算法详解及Python实现

聚类算法主要包括K均值（K-Means）聚类、凝聚聚类以及DBSCA算法。本节主要介绍DBSCA算法
DBSCAN是一种基于密度的空间聚类算法，是一种无监督的ML聚类算法。它可以替代KMeans和层次聚类等流行的聚类算法。
DBSCAN算法的工作原理：通过对特征空间内的密度进行检测，密度大的地方会认为是一个类，而密度相对小的地方它会认为是一个分界线，不需要一开始指定聚类的数量。
DBSCA算法有两个非常重要的参数：一个是eps,一个是min_samples。eps指定的是考虑划入同一坨的样本距离有多远，min_samples参数指定的是在某个数据点周围，被看成是聚类核心点的个数。

生成没有类别的数据点

DBSCAN算法聚类结果

python代码实现

blobs = make_blobs(random_state=1,centers=1)
X_blobs = blobs[0]
db = DBSCAN()
clusters = db.fit_predict(X_blobs)
plt.scatter(X_blobs[:, 0], X_blobs[:, 1], c=clusters, cmap=plt.cm.cool,
            s=60,edgecolor='k')
plt.xlabel("Feature 0")
plt.ylabel("Feature 1")
plt.show()

输出结果如下：