课件:KMeans算法对随机数据进行聚类分析
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 生成随机数据
X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60,random_state=0)
# 运行KMeans算法
kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
y_kmeans = kmeans.predict(X)
# 绘制散点图
plt.figure(figsize=(10, 8))
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.5)
# 中文标签
plt.title("随机数据的KMeans聚类结果", fontsize=14)
plt.xlabel("特征1")
plt.ylabel("特征2")
#plt.savefig("/mnt/data/kmeans_clustering.png")
plt.show()
程序已经生成了一幅展示KMeans聚类分析结果的图像。这张图中,我们用不同的颜色代表了不同的聚类中心,同时红色的点标记了各个聚类中心的位置。
在这个分析中,我们随机生成了一组数据点,并利用KMeans算法将它们分成了4个聚类。聚类分析的结果可以用来识别数据中的模式,为进一步的数据分析和解释提供依据。
![](https://img.haomeiwen.com/i25758024/2a80426a3c1db25b.png)
网友评论