GENIE3是一种从基因表达数据推断基因调控网络的方法。它训练预测数据集中每个基因表达的随机森林模型,并将转录因子(TF)的表达用作输入。然后使用不同的模型来得出TF的权重,测量它们各自的相关性以预测每个靶基因的表达。GENIE3的输出是一张带有调节基因,靶基因及权重的表格,它表示TF(输入基因)在预测目标中的权重。
library(GENIE3)
exprMatr <- matrix(sample(1:10, 100, replace=TRUE), nrow=20)
rownames(exprMatr) <- paste("Gene", 1:20, sep="")
colnames(exprMatr) <- paste("Sample", 1:5, sep="")
head(exprMatr)
GENIE3利用回归树从表达数据推断基因调控网络(以加权邻接矩阵的形式)。
weightMat[1:5,1:5]
选择候选调节因子
regulators <- c("Gene2", "Gene4", "Gene7")
weightMat <- GENIE3(exprMatr, regulators=regulators, treeMethod="ET", K=7, nTrees=50)
weightMat
linkList <- getLinkList(weightMat)
dim(linkList)
head(linkList)
参考:
https://www.nature.com/articles/nmeth.4463
https://bioconductor.org/packages/release/bioc/vignettes/GENIE3/inst/doc/GENIE3.html
网友评论