首先DESeq2在R-studio上的安装非常让人自闭,具体可参考徐洲更老师的R语言安装介绍https://www.bilibili.com/video/BV19p4y1i7Zb?from=search&seid=2717757288900359126,我认为最关键的问题是要用BioManager来安装,就像conda装软件也要写一个conda install -c bioconda XXX
。
#安装DESeq2包;
BiocManager::install("DESeq2")
#载入DESeq2包;
library(DESeq2)
输入矩阵数据(mycounts),行名为sample,列名为gene;对照组在前,实验组在后DESeq2不支持无生物学重复的数据,数据应是htseq-count的结果,如果是RSEM定量结果,要对count data取整,因为DESeq2包不支持count数有小数点,需要round取整。
#使用csv文件,在csv文件中把colnames改成文本,其它全部为数值。
#在R语言中csv的可读性非常好,其他格式非常容易让人自闭。
mycounts <- read.csv("Count_DH1_DH10_.csv")
rownames(mycounts) <- mycounts[,1]
##colnames列名
##rownames行名
mycounts <- mycounts[,-1]
condition <- factor(c(rep("DHF_",3),rep("DHT_",3)),levels = c("DHF_","DHT_"))
colData <- data.frame(row.names = colnames(mycounts),condition)
##dds=DESeqDataSet Object
dds <- DESeqDataSetFromMatrix(mycounts,colData,design = ~ condition)
#~在R里面用于构建公式对象,~左边为因变量,右边为自变量
dds <- DESeq(dds)
res= results(dds)
table(res$padj <0.05)
res <- res[order(res$padj),]
resdata <- merge(as.data.frame(res), as.data.frame(counts(dds, normalized=TRUE)),by="row.names",sort=FALSE)
write.csv(resdata,file = "9.Results_DHF_vs_DHT.csv")
网友评论