美文网首页
生信学习1

生信学习1

作者: 张雅婷_bf20 | 来源:发表于2018-11-12 14:44 被阅读0次

    基因数据库

    NCBI

    凡是涉及到基因相关信息,我们就会想到各式各样的基因数据库,一说到基因数据库就会忍不住想到NCBI,是的没错,我们打开NCBI查一查吧!结果如图:

    MALAT1在人体不同组织中的表达,横坐标为sample,纵坐标为RPKM:RPKM是Reads Per Kilobase per Million mapped reads的缩写,代表每百万reads中来自于某基因每千碱基长度的reads数。RPKM是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)。

    假如reads长度是150 bp,测序深度30X,按照(30亿*30X的深度/150reads长度)=可得6亿条reads,那么根据图可知emm...这个MALAT1的每百万条reads里就有5-150条有MALAT1(Jimmy说RPKM到达100就算是高的了)。

    NIH-GTEX

    GTEx是一个收录正常人体组织的测序结果的基因数据库。搜索MALAT1后结果如下,可见MALAT1在正常人体组织中的TPM(Transcripts per million)是非常高。

    GeneCards®: The Human Gene Database

    GeneCards类似于各大基因数据库的搜索引擎和总结。搜索MALAT1--转到Expression section后结果如下:

    如图可知MALAT1的RNAseq数据,其FPKM (Fragments Per Kilobase Million)含量也是非常高的。

    综上所述,从三个基因数据库查阅得知,MALAT1确实是一个高丰度且分布广泛的基因。

    只不过,RPKM、TPM、FPKM三个单位是不是让你傻傻分不清楚这是啥玩意儿,没错我也很好奇,所以狠狠的撸了一把StatQuest的教学视频,想要了解的小伙伴,留言让我知道~那我们还可以出一波RPKM、TPM、FPKM解说推文~~

    相关文章

      网友评论

          本文标题:生信学习1

          本文链接:https://www.haomeiwen.com/subject/hsccfqtx.html