知识分享之Python——sklearn中K-means聚类算法输出各个簇中包含的样本数据
背景
日常我们开发时,我们会遇到各种各样的奇奇怪怪的问题(踩坑o(╯□╰)o),这个常见问题系列就是我日常遇到的一些问题的记录文章系列,这里整理汇总后分享给大家,让其还在深坑中的小伙伴有绳索能爬出来。
同时在这里也欢迎大家把自己遇到的问题留言或私信给我,我看看其能否给大家解决。
开发环境
- 系统:windows10
- 版本:Python3
内容
本节分享一个在sklearn中使用聚类算法时,比较常用的输出工具,输出各个簇中包含的样本数据,以下是其具体的实现方式:
kmeans_model = KMeans(init="k-means++",n_clusters=t)
kmeans_model.fit(tf_matrix) # 训练是t簇,指定数据源
# 输出各个簇中包含的样本数据
labels = kmeans_model.predict(tf_matrix)
clusters = {}
n = 0
for item in labels:
if item in clusters:
clusters[item].append(all_data[n])
else:
clusters[item] = [all_data[n]]
n +=1
for item in clusters:
print("输出簇: ", item)
for i2 in clusters[item]:
print(i2)
本文声明:
88x31.png知识共享许可协议
本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。
网友评论