由于ubuntu下安装R最新版一直失败,各种尝试均不奏效,只能选择在windows下试一试,结果一路OK。
Windows安装R
下载R的windows版本:
https://mirrors.tuna.tsinghua.edu.cn/CRAN/
下载Rstudio
https://rstudio.com/products/rstudio/download/#download
下一步下一步就ok
现在ubuntu下安装R3.6.2成功了
sudo add-apt-repository 'deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran35/'
sudo apt update
sudo apt install r-base
安装DESeq2
R有时报错需要选择合适的镜像。建议先安装Rtools 和git
install.packages("BiocManager")
BiocManager::install(version = "3.10")
Sys.setenv(R_INSTALL_STAGED = FALSE) #这一句对于3.6.2非常重要缺少此命令,R3.6版本安装deseq2存在权限不足的情况!
BiocManager::install("DESeq2")
library("DESeq2")
下面的文件为Samplelist.csv内容
sampleid genotype time
SRR3784916 Resistant 0hr
SRR3784934 Resistant 0hr
SRR3785115 Resistant 0hr
SRR3785116 Resistant 24 hr
SRR3785165 Resistant 24 hr
SRR3785169 Resistant 24 hr
SRR3785170 Resistant 48 hr
SRR3785181 Resistant 48 hr
SRR3785250 Resistant 48 hr
SRR3785258 Susceptible 0hr
SRR3784995 Susceptible 0hr
SRR3785000 Susceptible 0hr
SRR3785010 Susceptible 24 hr
SRR3785023 Susceptible 24 hr
SRR3785024 Susceptible 24 hr
SRR3785063 Susceptible 48 hr
SRR3785089 Susceptible 48 hr
SRR3785093 Susceptible 48 hr
在Rstudio中
1、 将基因或转录本的count matrix和lable载入:
#首先将R的工作目录设置成stringtie处理结束之后的目录:
#列出当前工作目录
> getwd()
#变更新的工作目录
> setwd("D:/tamato")
> countData <- as.matrix(read.csv("gene_count_matrix.csv", row.names="gene_id"))
#gene_count_matrix.csv由python脚本 prepDE.py生产
> colData <- read.csv(PHENO_DATA, sep="\t", row.names=1)
# PHENO_DATA 要改成自己生成的文件,我自己的文件名为:Samplelist.csv,所以第二行命令改为:
> colData <- read.csv("Samplelist.csv", sep="\t", row.names=1)
2、检查两个文件匹配情况:
> all(rownames(colData) %in% colnames(countData))
[1] TRUE
> countData <- countData[, rownames(colData)]
> all(rownames(colData) == colnames(countData))
[1] TRUE
# 输出【TRUE】表明counts矩阵表头和samplist可以对应起来。
3、从count matrix和lable创建 DESeqDataSet 数据集
> dds <- DESeqDataSetFromMatrix(countData = countData, colData = colData, design = ~ CHOOSE_FEATURE)
#注意 “~” 后的CHOOSE_FEATURE 应该换成自己所关注的特征,我所关注的特征为“genotype”,则命令为:
> dds <- DESeqDataSetFromMatrix(countData = countData, colData = colData, design = ~ genotype)
4、运行DEseq2处理数据集,生成结果的表并写入文件
> dds <- DESeq(dds)
> res <- results(dds)
#4.8 根据p-value进行排序
> (resOrdered <- res[order(res$padj), ])
#将排序的结果写入文件
write.csv(resOrdered,file = "DE_results.csv")
网友评论