主要更新内容:
- 对GeneID做了防呆处理。
- 对表型数据和表达量数据的sample排序做了防呆处理。
- 增加了两个函数
- mergeCutHeight 模块合并剪枝高度
- minModuleSize 模块最小基因数量
解释:
-
GeneID防呆处理,有些用户反映说会报表达量矩阵有空行等错误,看过之后发现大部分都有一个特点,就是geneID是纯数字,要知道,在R里面读取数据
read.table
时,如果你这一列都是数字,R会自动的认为这一类的数据类型是numeric,其实在把表达量矩阵读取到R之后,有一步操作是把第一列GeneID变为行名rownames
,如果恰好你的geneID是纯数字,而且连续性较差,会导致rownames
的不连续,r会认为跳过的那些行是缺失行,在后续会报错。这里的解决方案就是读取进来后把第一列geneID的数据类型直接转换为字符串character
-
表型数据和表达量数据的样品顺序防呆处理:由于习惯原因,我在之前的项目中首先会把表达量数据和表型数据中sample的顺序调整成一致的,然而在我的脚本中并没有考虑到他们不一致的情况,以至于到后面做
trait-module
的时候如果你表型和表达量的顺序不一致会出现张冠李戴,这里我加了一样代码用match
命令将表达量和表型数据的rowname进行匹配。这里建议用户重新做一遍之前的数据,防止出错!! -
增加两个参数:之前在做的时候由于我的模块太多,于是我把
Cluster DendrogrammergeCutHeight
调大了(0.4,官网建议0.25),这个函数最粗糙的理解就是你把基因做了聚类之后通过对聚类数高度的修剪把基因划分到一个个模块中,如果这个高度越小,划分的模块越多,这个高度越大,小模块就会被合并到一起,从而模块越少,对比02.xxx.module.pdf
。这里把这个参数放开自己调整,这样还有个好处,合并了很多小模块之后很可能模块内基因的表达模式也有不同,那么在与性状做关联的时候可能关联性也比较低。那么是不是把模块划分的更加细致后可能得到比较高的相关。
minModuleSize
这个参数是确定模块最小基因数目的。更新方法:
方法一: 从高速插件商店安装
image
方法二: 从gitee下载安装
OneStepWGCNA-plugin点击链接,然后下载。
网友评论