无监督:聚类与改进聚类详解

作者: a微风掠过 | 来源:发表于2018-02-23 16:38 被阅读18次

聚类:
聚类就是将相似的对象聚在一起的过程。如总统大选,选择那部分容易转换立场的表决者,进行针对性的宣传,可以扭转局势。
聚类将相似的对象归到同一簇中,相似取决于相似度度量方法。
K-means聚类,可能收敛到局部最小值,在大规模数据集上收敛较慢。
K-means聚类:首先,随机确定k个初始点作为质心,将数据集中的每个点分配到一个簇中,即选择一个最近的质心进行分配,而后每个簇的质心更新为该簇所有点的平均值。
直到类间距离足够大,类内距离足够小。
随机初始化质心时,必须找到数据集的边界,通过找到数据集中每一维数据的最大和最小值,然后生成0-1之间的随机数并通过取值范围和最小值确保随机点在数据的边界之类。

用于度量聚类效果的指标可以是SSE(误差平方和)。我们可以通过增加簇的数量来减小SSE,若想要保持簇的总数不变,可以将某两个簇进行合并。
合并的方法:(1)合并最近的质心;(2)合并两个使得SSE增幅最小的质心,该方法必须在所有可能进行合并的簇之间做计算SSE。

二分K-means:
首先将所有点作为一个簇,然后将该簇一分为二,之后选择一个簇继续进行划分,选择哪一簇取决于 对其划分是否可以最大程度上降低SSE的值(类似于决策树的思想),不断划分,直到得到指定的簇的数目。

应用:对地图上的点进行聚类,从而用比较合理的大巴接送方案完成一个活动或一次旅行。
为出租车和乘客选择合适的候车点等。

相关文章

  • 无监督:聚类与改进聚类详解

    聚类:聚类就是将相似的对象聚在一起的过程。如总统大选,选择那部分容易转换立场的表决者,进行针对性的宣传,可以扭转局...

  • 聚类算法k-means

    聚类算法 聚类算法 是 无监督学习 聚类算法有特征,无标签,是无监督分类。 sklearn 聚类模块 cluste...

  • 机器学习-吴恩达笔记8(1)之K-means

    Week8-聚类与降维 无监督学习unsupervised learning 无监督学习简介 聚类和降维是无监督学...

  • 9.machine_learning_clusting_and_

    机器学习聚类与降维 机器学习中的聚类算法 聚类是一种经典的无监督学习方法,无监督学习的目标是通过对无标记训练样本的...

  • 10 集成学习;聚类学习分类图像

    聚类无监督学习

  • 聚类算法

    #聚类算法 标签(空格分隔): 机器学习 聚类算法 --- ###聚类算法的原理 无监督算法,相似的样本自动归...

  • 全面解析Kmeans聚类(Python)

    一、聚类简介 Clustering (聚类)是常见的unsupervised learning (无监督学习)方法...

  • 3.1.1.9 聚类

    聚类 原理 《机器学习》周志华 9.1 聚类任务 在“无监督学习”(unsupervised learning)中...

  • 深度学习的一些基本概念(一)

    申明:非原创,转载自《有监督学习、无监督学习、分类、聚类、回归等概念》 有监督学习、无监督学习、分类、聚类、回归等...

  • 【机器学习与R语言】11- Kmeans聚类

    1.理解Kmeans聚类 1)基本概念 聚类:无监督分类,对无标签案例进行分类。 半监督学习:从无标签的数据入手,...

网友评论

    本文标题:无监督:聚类与改进聚类详解

    本文链接:https://www.haomeiwen.com/subject/bomxxftx.html