美文网首页
2020.2.2 R语言|Practice2

2020.2.2 R语言|Practice2

作者: 哈喽迷人鬼们 | 来源:发表于2020-02-03 22:20 被阅读0次

    2020.2.2 R语言|Practice2

    今日学习内容一览

    一、Jimmy 生信技能树B站P7-P10(课上积累)

    二、R语言初级练习题目三道代码过程

    三、Markdown和R Markdown的学习网站收藏

    • R语言初级练习题目三道 代码过程

    1. 根据R包org.Hs.eg.db找到下面ensembl 基因ID 对应的基因名(symbol)
      • 首先得到gene_id和ensemble_id的关系矩阵g2e以及gene_id和symbol的关系矩阵g2s.

        library(org.Hs.eg.db) install.packages("org.Hs.eg.db") library(org.Hs.eg.db) g2s=toTable(org.Hs.egSYMBOL) g2e=toTable(org.Hs.egENSEMBL)

        g2e.png
    g2s.png
    • 其次绘制出样本矩阵,并提取小数点前面的数字新增一列

      a=read.table("寻找基因.txt") library(stringr) library("str_split") str_split(a$V1,'[.]') unlist(str_split(a$V1,'[.]')) class(unlist(str_split(a$V1,'[.]'))) a$ensembl_id=str_split(a$V1,'[.]',simplify = T)[,1]

    • 通过共有的ensembl_id建立样本矩阵与g2e的合并矩阵,再通过合并矩阵与g2s共有的gene_id建立第二个合并矩阵,最后通过match函数调整顺序后导出储存即可。
    `b=merge(a,g2e,by='ensembl_id',all.x=T)
     d=merge(b,g2s,by='gene_id',all.x=T)
     d=d[order(d$V1,)]
     d=d[match(a$ensembl_id,d$ensembl_id)]
     head(match(a$ensembl_id,d$ensembl_id,))
     d=d[match(a$ensembl_id,d$ensembl_id),]
     write.csv('d,gene find.csv')`
    
    1. 根据R包hgu133a.db找到下面探针对应的基因名(symbol)
      • 首先使用read.table函数读取样本文件

        rm(list=ls()) options(stringsAsFactors = F) a=read.table('基因ID转换.txt')

      • 其次使用hgu133plus2.db这个R包导出probe_id与symbol的对应矩阵,最终使用merge函数合并原样本矩阵和对应矩阵共有的probe_id即可

        library(hgu133plus2.db) ids=toTable(hgu133plus2SYMBOL) colnames(ids) colnames(a)='probe_id' d=merge(a,ids,by='probe_id')

        d.png
    1. 找到R包CLL内置的数据集的表达矩阵里面的TP53基因的表达量,并且绘制在 progres.-stable分组的boxplot图
      • 读取内置数据库CLL并查看矩阵,同时使用pData查看其分组信息

        rm(list=ls()) library(CLL) data(sCLLex) expr <- exprs(sCLLex) pdata <- pData(sCLLex) head(expr)

    • 使用hgu95av2.db这个R包得到probe_id和symbol的表达关系矩阵,再使用grep函数挑选出其中symbol==TP53的probe_id并建立为一个新矩阵

      library(hgu95av2.db) probe_sym <- toTable(hgu95av2SYMBOL) tp53_probes <- probe_sym[grep("TP53$", probe_sym$symbol),]

    • 使用boxplot函数对三个相应的探针ID绘图

      boxplot(expr['1939_at',]~pdata$Disease) boxplot(expr['1974_s_at',]~pdata$Disease) boxplot(expr['31618_at',]~pdata$Disease)

      1939.png
    1974.png 31618.png
    • 最后,使用ggpubr合并图像,调整各项参数,改变检验方法等。

      library(ggpubr) tp53_pub <- cbind(expr['1939_at',], as.data.frame(pdata$Disease)) colnames(tp53_pub) <- c('Expression',"Group") p <- ggboxplot(tp53_pub, y='Expression', x='Group',fill = 'Group', palette = 'aaas' ,add = 'jitter')p + stat_compare_means() p + stat_compare_means(method = 't.test')

      Rplot.png
    • Markdown和R Markdown的学习网站收藏

    1. Markdown基本语法
    2. 进阶版Markdown的使用
    3. R Markdown

    相关文章

      网友评论

          本文标题:2020.2.2 R语言|Practice2

          本文链接:https://www.haomeiwen.com/subject/idflxhtx.html