【零基础练习一个RNA-seq分析】CH6：关于R以及表达矩阵的

作者: josia_luo | 来源:发表于2020-08-15 00:15 被阅读0次

【零基础练习一个RNA-seq分析】CH6：关于R以及表达矩阵的
limma和edgeR对RNA-seq表达矩阵差异分析的区别
1.Empirical assessment of analys
DNA甲基化数据分析(二)
R语言DESeq2基因差异表达分析
RNA-seq 详细教程：分析流程介绍（1）
从0开始的RNA-seq教程
ensembl_id转换与gene symbol基因名去重复的两
转录组差异表达分析—ballgown
使用DSS做差异甲基化区域（DMR分析）

到这里我们移师R，由于R是一个可视化的软件，我们下载Windows版的R就好了。这里我们讲一讲一些必要R包的安装，最后把上一步的表达矩阵做一个合并（这一步用excel也可以）。

下载和安装R

这里我们需要三个软件，Rproject，Rstudio，Rtools。这里需要注意，安装路径不能有中文，否则无法运行，建议直接默认路径就好。
我们接着打开Rstudio，工具栏tool<global option<general选择一下R的默认工作路径和R的源文件

安装一些R包

对于我这个无任何计算机基础的人来说，更习惯把R当成一个用命令行操作的excel来学习，在这个语境下，我们就可以理解R包的作用。excel处理数据依赖公式和函数，R亦然，R包就是这些函数分门别类的集合。因为之后要用到好几个R包。我们先用基础的安装方式安装一个ggplot2

install.pachages("ggplot2")

对于生信相关的软件，我们用bioconductor进行安装，首先访问bioconductor官网安装bioconductor

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install(version = "3.11")

这之后我们就可以在bioconductor网站搜索我们要找的包，复制代码进行安装了。这里我们需要的包有：clusterProfiler、stringr、DOSE、DESeq2、apeglm、

矩阵合并

我们先导入一下count文件

control1<-read.table("SRR3589959.count",sep = "\t",col.names = c("gene_id","control1"))
control2<-read.table("SRR3589961.count",sep = "\t",col.names = c("gene_id","control2"))
treat1<-read.table("SRR3589960.count",sep = "\t",col.names = c("gene_id","treat1"))
treat2<-read.table("SRR3589962.count",sep = "\t",col.names = c("gene_id","treat2"))

#前提是Rstudio的工作目录和count文件在同一个文件夹，否则需要完整路径

接下来用进行合并和一些整理工作

raw_count <- merge(merge(control1, control2, by="gene_id"), merge(treat1, treat2, by="gene_id")) #merge函数整合
raw_count_filt <- raw_count[-1:-5,] #删除前五行
ENSEMBL <- gsub("\\.\\d*", "", raw_count_filt$gene_id)
row.names(raw_count_filt) <- ENSEMBL #转换一下gene id，变成整数

接下来看几个具体的基因吧，基因的编号可以去uniprot查找

AKAP95 <- raw_count_filt[rownames(raw_count_filt)=="ENSMUSG00000024045",]
AKAP95

网友评论

本文标题：【零基础练习一个RNA-seq分析】CH6：关于R以及表达矩阵的

本文链接：https://www.haomeiwen.com/subject/ehpgrktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

【零基础练习一个RNA-seq分析】CH6：关于R以及表达矩阵的

下载和安装R

安装一些R包

矩阵合并

相关文章

【零基础练习一个RNA-seq分析】CH6：关于R以及表达矩阵的

limma和edgeR对RNA-seq表达矩阵差异分析的区别

1.Empirical assessment of analys

DNA甲基化数据分析(二)

R语言DESeq2基因差异表达分析

RNA-seq 详细教程：分析流程介绍（1）

从0开始的RNA-seq教程

ensembl_id转换与gene symbol基因名去重复的两

转录组差异表达分析—ballgown

使用DSS做差异甲基化区域（DMR分析）

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读