美文网首页
聚类分析

聚类分析

作者: 护国寺小学生 | 来源:发表于2019-01-31 19:02 被阅读0次

"""

scipy.cluster是scipy下的一个做聚类的package, 共包含了两类聚类方法:

1. 矢量量化(scipy.cluster.vq):支持vector quantization 和 k-means 聚类方法

2. 层次聚类(scipy.cluster.hierarchy):支持hierarchical clustering 和 agglomerative clustering(凝聚聚类)

聚类方法实现:k-means和hierarchical clustering.

"""

import scipy

import scipy.cluster.hierarchy as sch#层次聚类

from scipy.cluster.vq import vq,kmeans,whiten#矢量量化

import numpy as np

import matplotlib.pylab as plt

#生成待聚类的数据点,这里生成了20个点,每个点4维:

points=scipy.randn(20,4) 

#1. 层次聚类

#生成点与点之间的距离矩阵,这里用的欧氏距离:

disMat = sch.distance.pdist(points,'euclidean')

#进行层次聚类:

Z=sch.linkage(disMat,method='average')

#将层级聚类结果以树状图表示出来并保存为plot_dendrogram.png

P=sch.dendrogram(Z)

plt.savefig('plot_dendrogram.png')

#根据linkage matrix Z得到聚类结果:

cluster= sch.fcluster(Z, t=2, criterion='inconsistent')

print("Original cluster by hierarchy clustering:\n",cluster)

#2. k-means聚类

#将原始数据做归一化处理

data=whiten(points)

#使用kmeans函数进行聚类,输入第一维为数据,第二维为聚类个数k.

#有些时候我们可能不知道最终究竟聚成多少类,一个办法是用层次聚类的结果进行初始化.当然也可以直接输入某个数值.

#k-means最后输出的结果其实是两维的,第一维是聚类中心,第二维是损失distortion,我们在这里只取第一维,所以最后有个[0]

centroid=kmeans(data,max(cluster))[0] 

#使用vq函数根据聚类中心对所有数据进行分类,vq的输出也是两维的,[0]表示的是所有数据的label

label=vq(data,centroid)[0]

print("Final clustering by k-means:\n",label)

相关文章

  • 2019-03-07

    聚类分析 单击→聚类分析 (欢迎关注微信公众号:spss学习乐园) 聚类分析 聚类分析:研究如何将样品或变量进行分...

  • 手把手教你用SPSSAU做聚类分析

    聚类分析:聚类分析是通过数据建模简化数据的一种方法。“物以类聚,人以群分”正是对聚类分析最好的诠释。本文就具体介绍...

  • 聚类分析的原理和应用(-)

    本文主要介绍 聚类分析的一些基本概念和原理 聚类分析的方法 聚类分析是在没有指定类别的时候,根据个案(记录)之间的...

  • 利用聚类算法研究大数据微信公众号实例

    聚类分析可以用在APP及网站数据分析、用户画像分析上。 1.什么是聚类分析 聚类分析就是把看得见的实体对象(如桌子...

  • 聚类分析(1)之市场细分

    在市场研究中,聚类分析用的最多的就是细分市场。笔记结合两个问题:聚类分析、市场细分。聚类分析是市场细分的一个统计方...

  • 聚类分析

    1,聚类方法: Python 主要聚类分析方法: 2,聚类分析算法评估 ☉ Purity评估方法 ☉ RI评价法 ...

  • 深入推荐引擎相关算法 - 聚类

    聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster)...

  • 干货合集-聚类分析

    一、聚类分析方法分类 聚类分析方法可分为Q型和R型,如下图: SPSSAU-进阶方法-聚类 SPSSAU-进阶方法...

  • 聚类分析中的空间和距离概念

    聚类分析的意义Cluster Analysis 在经济和社会学研究中,聚类分析是比较常用的多元统计分析方法,是将大...

  • 深入浅出介绍聚类分析

    作者:麦茬道审稿:童蒙编辑:amethyst 聚类分析是生信分析中常用的工具,在转录组分析中经常用到。聚类分析将表...

网友评论

      本文标题:聚类分析

      本文链接:https://www.haomeiwen.com/subject/pvnwtqtx.html