美文网首页
层次聚类

层次聚类

作者: 程序猿爱打DOTA | 来源:发表于2017-05-31 22:53 被阅读0次

试图在不同层次对数据集进行划分,从而形成树形的聚类结构。自顶向下或自底向上均可

AGNES :自底向上

初始所以样本为一个簇,每一步合并距离最近的簇进行合并

关键在于如何计算距离:

最小距离: 单链接

最大距离: 全链接

平均距离: 均链接

DIANA:自顶向下

分解:大类分解成更小的类,如何使得分类后的小类之间的相似度尽可能小,而类内数据之间的相似度尽可能大,即类间类内距离的测度

分解:类间、类内的相似度的大小程度的界定;

子类:每一次分解得到新的子类(数目,大小,代表点等)如何确定

 存在的问题:上述列出的几个关键点其实都跟该算法的问题紧密相关,作为一种无监督的聚类算法,由于是无监督的,事先并不知道最终要聚成多少类,那么又如何得知构建层次的时候中间层要聚成多少类呢?因此每一层的聚类数目是很难确定的,这样聚类层次就会呈现多样化,算法的稳定性也随之降低。另外,一个最突出的问题,自顶向下的方案,如果上层对数据分类错误,那么进一步分层量化时就会越错越远,这就要求,越是高层,越是尽可能的不能分错(高层类的数目少,但对分类精度要求大)。由于高层即使分错了,下面的层也不会纠错,因此这种单纯的自顶向下的层次聚类方案的聚类结果很粗糙,导致这种粗糙的最主要原因是由构建的树图结构造成的。

相关文章

  • 数据挖掘

    数据立方体,最小内存计算 层次聚类 首先介绍聚类中的层次聚类算法。层次法又分为凝聚的层次聚类和分裂的层次聚类。 凝...

  • R 实现聚类分析_07Jul2020

    聚类分析 层次聚类 kmeans 使用eclust进行kmeans聚类或层次聚类

  • 11 聚类算法 - 密度聚类 - DBSCAN、MDCA

    09 聚类算法 - 层次聚类10 聚类算法 - 代码案例四 - 层次聚类(BIRCH)算法参数比较 七、密度聚类概...

  • 聚类分析

    均值聚类 层次聚类

  • 09 聚类算法 - 层次聚类 - CF-Tree、BIRCH、C

    08 聚类算法 - 聚类算法的衡量指标 五、层次聚类概述 层次聚类方法对给定的数据集进行层次的分解,直到满足某种条...

  • 层次聚类算法与层次聚类优化算法

    层次聚类 对给定的数据集进行层次分解或者合并直到某个条件结束 层次聚类算法分为两大类1 凝聚的层次聚类(AGNE...

  • 层次聚类

    一、了解层次聚类 层次聚类方法对给定的数据集进行层次的分解,直到满足某种条件为止,传统的层次聚类算法主要分为两大类...

  • 层次聚类

    层次聚类分支 1)分裂法从上到下对大类别进行分割2)凝聚法从下到上对小类别进行聚合 层次聚类优点 kmeans中需...

  • 层次聚类

    层次聚类算法分为:自底向上的AGNES算法和自上而下的DIANA算法 讲一下AGNES算法,没有最仔细,只有更仔细...

  • 层次聚类

    试图在不同层次对数据集进行划分,从而形成树形的聚类结构。自顶向下或自底向上均可 AGNES :自底向上 初始所以样...

网友评论

      本文标题:层次聚类

      本文链接:https://www.haomeiwen.com/subject/bhfsfxtx.html