美文网首页BioinformaticsWGCNA分析RNA-Seq
简单粗暴,就是WGCNA的流程图和原理

简单粗暴,就是WGCNA的流程图和原理

作者: 小梦游仙境 | 来源:发表于2019-11-25 22:32 被阅读0次

    WGCNA的原理如果不掌握的话,就很难在做WGCNA分析的过程中,利用手中的代码去修改参数,就无法得到满意的图图。所以,下面放几篇文献中的WGCNA的流程图,供参考

    <img src="../../Library/Application Support/typora-user-images/image-20191121211313666.png" alt="image-20191121211313666" style="zoom: 50%;" />

    <img src="../../Library/Application Support/typora-user-images/image-20191121211330496.png" alt="image-20191121211330496" style="zoom:50%;" />

    <img src="../../Library/Application Support/typora-user-images/image-20191121211340735.png" alt="image-20191121211340735" style="zoom:50%;" />

    <img src="../../Library/Application Support/typora-user-images/image-20191121211349820.png" alt="image-20191121211349820" style="zoom: 67%;" />

    然后放上参考链接

    一文学会WGCNA分析

    WGCNA 分析

    下面是网易云课堂的视频中图片+自己注释理解

    下面视频中WGCNA基础的理解

    image-20190904072401723

    WGCNA基本理论参考:

    image-20190904073115126

    对应开发的R包:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/

    image-20190904074234355

    通过学习,关注模块基因的功能,而不是单一基因的功能,将结果进行可视化并且和形状数据进行联合分析,挖掘基因模块和形状之间存在的练习

    image-20190904074509710 image-20190904074517348
    • 得到关系矩阵后要将关系矩阵转为邻接矩阵,建立邻接矩阵的目的就是建立一个基因共表达网络
    • 网络可以用矩阵表示,用一维数组存储网络中所有的点,用二维数组存储网络中点和点之间的关系(两个点和点直接的连线)
    image-20190904075626397

    未加权网络的点只存在0和1的关系,所能反应的信息较少,不能反映点和点之间关系的强弱

    加权网络:点和点之间的联系不在仅仅是0和1,而是一个连续的数值,数值大小对应边的权重值,可以反映点和点之间的强弱程度

    • 转换成未加权网络的邻接矩阵,以0.8的为界,但是会丢失很多数据,形成的网络只反映基因与基因直接是否存在关联,有关联为1,无关联为0,不能反映基因和基因之前联系的强弱

      image-20190904075914047
    • ​ 转换成加权网络,将关系矩阵进行幂运算,幂指数定为的数,要使共表达网络满足无尺度网络

    image-20190904080144986

    无尺度网络中,连通性高的点占的数值很少,二连通性低的点占的数值很大,如上图中,显示不同联通性的点在网络中所占的频数

    在未加权网络中,达到连接数为i的概率p(i)与i的n次方成反比就是无尺度网络

    在加权网络中,标准为log10(p(k)) versus log10(k) 负相关,k对应的是加强网络中点的连通性

    用贝塔值在0 和30之间,分别计算log10(p(k))和log10(k) ,计算后的结果进行拟合,判断哪个贝塔值更满足这一log10(p(k)) versus log10(k) 负相关这一标准

    image-20190904082039395

    要求拟合指数R2值(SFT.R.sq)大于0.8,回归线的斜率要求在-1左右,平均联通性mean.k要求尽量大,对应的数据可以绘制出右边的散点图

    右一图可以看到不同的贝塔值对应的拟合指数的大小,绘制的红线可以帮助判断那个拟合指数R2值对应的power也就是贝塔值大于0.9,也可以绘制在0.8或0.5的位置

    右二图,看贝塔值和联通性,更有助于发现hub基因

    image-20190904082914649

    如上图所示,贝塔值选择6时,R2指数更接近无尺度网络(生物学中大多是无尺度网络),最终选择6

    确定了贝塔值之后,就可以将关系矩阵转化为邻近矩阵,接下来就可以转换为tom重叠矩阵。为什么要转换为tom矩阵?是因为在wgcna中,认为模块是tom重叠性基因高的基因,所以需要计算基因和基因之间的tom重叠性,从而判断哪些基因应该属于同一个模块,哪些基因不在同一个模块。

    具体的转换公式为:通过下面这个公式可以计算基因和基因之间的tom重叠性,将邻接矩阵转换为tom重叠矩阵。

    image-20190904172647065 image-20190904181505938

    用tom相异程度进行聚类的时候,可以得到如下图

    image-20190904181903295

    建立基因模块后,可以将模块用颜色来区分,有些模块相似性高,就需要将模块合并。将模块特征基因进行聚类,在完成聚类后合并,0.25高度对应的相似度阈值就是0.75。具体的相似性阈值可以自行设置,进行聚类剪切后,就可以区分哪些模块相似性高,哪些模块相似性低,如下图。

    image-20190904183934732

    接下来,可以计算基因模块和形状的相关性

    image-20190904184012576

    上图中,右边标尺越红表示正相关性越高,越绿表示负相关性越高

    ,从图中可以看出哪些形状和哪些模块相关性比较高,可进一步分析

    image-20190904190708794

    将GS和MM进行绘图如下

    image-20190904185815152

    可以知道,上面蓝框圈住的那个地方的基因,对性状影响比较大,同时MM值也比较大。同时可以对前面的红色箭头的weight来进行验证。

    此外还有如下图的可视化展示

    image-20190904191659534

    还可以将模块特征基因进行可视化-模块特征基因的聚类树及绘制模块特征基因相关性的热图,如下图

    image-20190904192849587

    第三方软件,可以依据weight值的大小进行筛选,从而绘制出不同网络图

    image-20190904193225172

    第三列对应的是tom重叠性

    weight值越高,筛选出的相互关系越少,反正越多。

    可以通过连线的多少来判断是否为Hub基因。

    对Hub基因和感兴趣基因,可以进行KEGG、GO富集分析,但要有对应的注释R包。

    image-20190904193559496

    完成啦

    最后友情宣传生信技能树

    相关文章

      网友评论

        本文标题:简单粗暴,就是WGCNA的流程图和原理

        本文链接:https://www.haomeiwen.com/subject/yzdswctx.html