美文网首页
网络CSI评估基因关联性及regulon聚类模块化

网络CSI评估基因关联性及regulon聚类模块化

作者: 生信云笔记 | 来源:发表于2024-02-06 11:46 被阅读0次

  在座各位,除了没放假的人,剩下的应该都放假了吧!放假回家过年前,最终还是决定要来见一下各位!

  学习单细胞转录因子分析流程SCENIC的时候,在一篇文献中看到过下面这样一张图。还不清楚SCENIC的同学可以移步这里:[pyscenic | 单细胞转录因子分析,原理图文详解]。

图注描述:

(A) Identified regulon modules based on regulon connection specificity index (CSI) matrix, along with representative transcription factors, corresponding binding motifs, and associated cell types.
(B) Zoomed-in view of module M7 identifies sub-module structures.
(C) Different sub-modules in M7 are associated with distinct immune cell types and regulon activities.

  想要搞明白上面的热图是怎么来的,那就得先搞清楚CSI是什么?由于CSI是基于bipartite network(二分网络)来计算的,所以首先还需了解bipartite network是什么,如下图所示:

  当一个网络的所有结点只能分成两类如上图中的X-typeY-type,同种类型内各结点之间没有联系,每种类别的结点只与另外一种类型的结点有联系,这样的网络称为bipartite network

  明白了bipartite network就可以来计算CSI了,下面来看看CSI的计算原理:

  可以看出CSIPCC (Pearson correlation coefficient)基础上得来,且只考虑相同结点类型,如上图计算AB间的CSI,只会考虑紫色类型结点C-F与A或B的PCC相较于ABPCC的情况 (而不考虑黄色结点),如其中PCC(A,C)大于 PCC(A,B) - 0.05,而D-F三个结点分别与A或B的PCC均小于PCC(A,B) - 0.05,故ABCSI3/6,可以看出CSI值越大两个基因间的关联性越大。

  为什么CSI可以更好地从网络角度反映结点间的关联性呢?因为CSI基于PCC描述了两个结点间的相关性在网络中的排序情况,从整体角度展示了两个节点间特异的相关性。如上图A-F为网络中的一类基因,如果仅仅计算AB间的PCC虽然可以说明这两个基因关系比较密切,但并不能说明两者间关系的特异性。但是,如果再考虑到其他结点点,考量PCC(A,B)超过多少其他结点分别与A或B的PCC情况,就可以知道AB间相关性的特异性怎么样。也就是说,这可以反映基因A与B间的关联度超过多少个与其他基因的关联,基因B与A间的关联度也超越多少个与其他基因的关联,说明基因A的表达与基因B更具相关性而不是与其他基因,基因B的表达也与基因A更紧密而不是与其他基因。因此,CSI不仅反映了基因间的相关性,也反映了这种相关性在网络整体中的关联程度。

  那么,现在咱们回过头来看开头提到的那张图,是如何计算regulon之间的CSI的呢?过程分为三步:首先,通过SCENIC流程得到regulon在细胞中的活性值;接着,基于活性值计算regulon间的PCC;最后,基于PCC计算regulon之间的CSI

  不过,这个时候的CSI与前面原本的略有不同,这里仅借用了CSI概念,计算过程不同。上面的CSI基于bipartite network,而此时的PCCregulon两两间的相关性为对称矩阵,所以计算CSI时忽略了bipartite network这个条件。例如regulon A和B间的CSI定义为所有与A或B相关的regulon里面,PCC小于PCC(A,B)的比例。

  得到了CSI就可以用来聚类画热图了,开头的那张热图便可以轻而易举地拿下了。当然,计算CSI无需手动计算,可以借助现有的包scFunctions里的函数calculate_csi来轻松搞定。

参考文献

<<Revealing the Critical Regulators of Cell Identity in the Mouse Cell Atlas>>
<<Using networks to measure similarity between genes: association index selection>>

相关文章

  • 聚类算法总结

    1、K 均值聚类 2、凝聚聚类 3、DBSCAN 算法 4、聚类算法的评估

  • 聚类算法的评估

    1、用真实值评估聚类 调整兰德系数 (Adjusted Rand index) 2、在没有真实值的情况下评估聚类 ...

  • RapidMiner(二)

    六、中文网页分类 建立中文网页分类模型并采用交叉验证评估 七、中文网页聚类 对中文网页聚类并进行外部指标评估 部件...

  • 08 聚类算法 - 聚类算法的衡量指标

    07 聚类算法 - 代码案例三 - K-Means算法和Mini Batch K-Means算法效果评估 四、聚类...

  • 层次聚类分析案例(三)

    之前的笔记:聚类介绍:点这里层次聚类分析案例(一)层次聚类分析案例(二) 案例三:基因聚类 获取全基因组表达数据的...

  • 生信与爬虫(一)爬取基因注释库网站的思路分析

    背景 我需要从约20个聚类的结果文件里面寻找到每个聚类的Marker基因,并且进行去重 然后对这些基因进行注释库搜...

  • 7.9 聚类模型评估

    如果有了类别标签,那么聚类结果也可以像分类那样计算准确率和召回率。但是不应该将分类标签作为聚类结果的评价指标,除非...

  • 聚类算法的评估

    聚类评估的任务是估计在数据集上进行聚类的可行性,以及聚类方法产生结果的质量。这一过程又分为三个子任务: 1、估计聚...

  • 聚类算法模型评估

    ● 混淆矩阵● 均一性● 完整性● V-measure● 调整兰德系数(ARI)● 调整互信息(AMI)● 轮廓系...

  • 10.单细胞 RNA-seq:聚类分析

    学习目标: 评估是否存在聚类过程产生的技术误差 使用 PCA 和 UMAP 图确定聚类质量,并了解何时重新聚类 评...

网友评论

      本文标题:网络CSI评估基因关联性及regulon聚类模块化

      本文链接:https://www.haomeiwen.com/subject/ktfvodtx.html