Hierarchical 聚类原理

Hierarchical 聚类原理

作者: 安哥生个信 | 来源:发表于2019-02-20 08:31 被阅读18次

层次聚类(hierarchical clustering)通常和热图(heatmap)密切相关。

绘制热图前，通常需要进行数据标准化处理。

关于数据标准化处理的内容，改天再补充。

层次聚类过程

假设我们现在有一个4×3的表达矩阵，希望对不同Gene进行聚类分析。

image

第一步，找出哪个Gene同Gene 1最相似；

通过颜色(表达值)很容易判断出Gene 1和Gene 2不相似，Gene 1和Gene 3/4相似，并且Gene 1和Gene 3的相似度是最大的

image

第二步，判断出Gene 2和Gene 4最为相似(然后依次判断Gene3/4的最似Gene)

image

第三步，在上述那些最似组合中，判断出哪两个Gene相似度最高，并将它们合并为一簇

在这里，Gene 1/3之间的相似度最高

image

第四步，重复第一至三步，只是现在需要将Cluster 1看作一个单位；通过比较发现Cluster 1同Gene 4最似

image

之后，我们依次获得，Gene 2 同Gene 4最似，Gene 4同Gene 2最似；其中Gene 2和Gene 4的相似度最高，合并为一簇
image

第五步，由于只剩下两个Cluster，所以我们将Cluster 1/2合并为Cluster 3

image

系统树构建

层次聚类结果通常伴随系统树一起展示，系统树不仅可以表现变量之间的相似性，也可以表明cluster形成顺序。

image

图片上把cluster1 2 3 标记来

上图中，Cluster 1分枝最短，表明其最先形成，它包含的两个变量相似度最大；Cluster 2分枝次短，它是第二个形成的，它包含的两个变量形似度也是第二相似；Cluster 3包含所有变量，分枝最长，是最后一个形成的。

相似性计算原理

欧式距离

假设现在有一个2×2的表达矩阵

image

Gene 1/2的欧氏距离(Euclidean distance)为

image

即 $\sqrt{(1.6-(-0.5))^2+(0.5-(-1.9))^2}$ ，最终计算得出数值为3.2。

如果有3个样本的话，只需要延长公式即可

image

其他可用来度量距离的方法有曼哈顿距离(manhattan distance)

image

二者的计算结果存在些许差异，没有绝对意义上谁优胜于谁，可以根据自己的需求来选择(哪种方法得到的结果好就选哪个)

image

cluster比较

前面说到，通过比较发现Gene 1/3之间相似性最大，然后将二者合并为Cluster 1,之后会用culster 1同其他基因继续比较。那么如何在cluter之间进行比较呢？

假设现在已经有两个cluster，绿色和橘色，现在需要判断灰色点属于哪一个cluster。

1.重心法(centroid) :比较灰色点同每个cluster的中心距离

image

2.最短距离法(single-linkage) :比较灰色点同每个cluster最临近点的距离

image

3.最长距离法(complete-linkage) :比较灰色点同每个cluster最远处点的距离

image

R语言中hclust函数的默认方法为complete-linkage

不同方法比较出来的cluster也存在些许区别，一般不用过多关注，选择层次聚类软件的默认设置就可以了。

image

Reference

https://www.youtube.com/watch?v=oMtDyOn2TCc

相关文章

网友评论

本文标题：Hierarchical 聚类原理

本文链接：https://www.haomeiwen.com/subject/uzhcyqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

生信算法

StatQuest

关于我们|服务条款|联系我们|Hierarchical 聚类原理|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！