美文网首页RNA-seq
11.6 RNA-seq表达rpkm数据操作实践(一)

11.6 RNA-seq表达rpkm数据操作实践(一)

作者: KK_f2d5 | 来源:发表于2018-11-06 20:55 被阅读77次

    在网上下载了txt文件,是rpkm,但是基因id中的名称搜索不到匹配内容。

    试一下用r注释:https://www.jianshu.com/p/ae94178918bc

    1、我们先下载r包:

    install packages失败可以:

      source("https://bioconductor.org/biocLite.R")

      biocLite("AnnotationHub")   (括号内是安装的包)

    library(AnnotationHub) 

    ah=AnnotationHub()   可以说是加载得相当慢了。。。。

    ah$species[which(ah$species == "Arabidopsis thaliana")]   查看你的物种在不在

       也可以使用:grs <- query(ah, "Arabidopsis thaliana")   query函数

    2、用DESeq2处理数据

    https://www.jianshu.com/p/3a0e1e3e41d0

    得到的结果

    测序数据做为countdata使用,要自己提前做一个coldata。全部按照网页教程做,有一步:

    conditions<-factor(colnames(mydata))  这样比较方便

    整个操作进行了一遍后发现,有很大的问题。

    首先deseq2不支持没有重复的数据,其次数据必须是整数,rpkm不是。所以我们白做了,rpkm数据可以直接画图了,但是想要得到p值检验等我们需要倒推到read count才可以。

    相关文章

      网友评论

        本文标题:11.6 RNA-seq表达rpkm数据操作实践(一)

        本文链接:https://www.haomeiwen.com/subject/gkhuxqtx.html