美文网首页
【零基础练习一个RNA-seq分析】CH6:关于R以及表达矩阵的

【零基础练习一个RNA-seq分析】CH6:关于R以及表达矩阵的

作者: josia_luo | 来源:发表于2020-08-15 00:15 被阅读0次

    到这里我们移师R,由于R是一个可视化的软件,我们下载Windows版的R就好了。这里我们讲一讲一些必要R包的安装,最后把上一步的表达矩阵做一个合并(这一步用excel也可以)。

    下载和安装R

    这里我们需要三个软件,Rproject,Rstudio,Rtools。这里需要注意,安装路径不能有中文,否则无法运行,建议直接默认路径就好。
    我们接着打开Rstudio,工具栏tool<global option<general选择一下R的默认工作路径和R的源文件


    安装一些R包

    对于我这个无任何计算机基础的人来说,更习惯把R当成一个用命令行操作的excel来学习,在这个语境下,我们就可以理解R包的作用。excel处理数据依赖公式和函数,R亦然,R包就是这些函数分门别类的集合。因为之后要用到好几个R包。我们先用基础的安装方式安装一个ggplot2

    install.pachages("ggplot2")
    

    对于生信相关的软件,我们用bioconductor进行安装,首先访问bioconductor官网安装bioconductor

    if (!requireNamespace("BiocManager", quietly = TRUE))
        install.packages("BiocManager")
    BiocManager::install(version = "3.11")
    

    这之后我们就可以在bioconductor网站搜索我们要找的包,复制代码进行安装了。这里我们需要的包有:clusterProfiler、stringr、DOSE、DESeq2、apeglm、

    矩阵合并

    我们先导入一下count文件

    control1<-read.table("SRR3589959.count",sep = "\t",col.names = c("gene_id","control1"))
    control2<-read.table("SRR3589961.count",sep = "\t",col.names = c("gene_id","control2"))
    treat1<-read.table("SRR3589960.count",sep = "\t",col.names = c("gene_id","treat1"))
    treat2<-read.table("SRR3589962.count",sep = "\t",col.names = c("gene_id","treat2"))
    
    #前提是Rstudio的工作目录和count文件在同一个文件夹,否则需要完整路径
    

    接下来用进行合并和一些整理工作

    raw_count <- merge(merge(control1, control2, by="gene_id"), merge(treat1, treat2, by="gene_id")) #merge函数整合
    raw_count_filt <- raw_count[-1:-5,] #删除前五行
    ENSEMBL <- gsub("\\.\\d*", "", raw_count_filt$gene_id)
    row.names(raw_count_filt) <- ENSEMBL #转换一下gene id,变成整数
    

    接下来看几个具体的基因吧,基因的编号可以去uniprot查找

    AKAP95 <- raw_count_filt[rownames(raw_count_filt)=="ENSMUSG00000024045",]
    AKAP95
    

    相关文章

      网友评论

          本文标题:【零基础练习一个RNA-seq分析】CH6:关于R以及表达矩阵的

          本文链接:https://www.haomeiwen.com/subject/ehpgrktx.html