美文网首页宏基因组分析
RPKM、FPKM、TPM的区别

RPKM、FPKM、TPM的区别

作者: 略略咯 | 来源:发表于2022-11-30 17:30 被阅读0次

    简写

    RPKM: Reads Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的reads)

    FPKM: Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments)

    RPM/CPM: Reads/Counts of exon model per Million mapped reads (每百万映射读取的reads)

    TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)

    RPKM

    RPKM--代表每百万reads中来自于某基因每千个碱基转录得到的reads数。是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)之和。

    RPKM计算公式

    total exon reads:样本中某个基因mapping到外显子上的所有的reads数

    mapped reads (Millions) :样本总reads数

    exon length(KB):某个基因的长度(外显子长度的总和,以KB为单位)

    RPKM公式简化

    FPKM

    FPKM与RPKM计算方法基本一致。FPKM 计算的是DNA片段(fragments),也就是一对reads。与RPKM 的差别主要体现在,FPKM在一对reads map上的情况下只计数1,而RPKM 会计为2。适用于双端测序。

    FPKM计算公式

    在单端测序中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;
    在双端测序中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。
    总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。

    FPKM(RPKM)适用于:同一个样本中基因A和基因B的相对表达量

    TPM

    TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)

    TPM计算公式

    Ni:比对到第i个exon的reads数

    Li:第i个exon的长度

    sum(N1/L1+N2/L2 + ... + Nn/Ln):所有 (n个)exon按长度进行标准化之后数值的和

    TPM其实跟RPKM,FPKM也很相似。TPM唯一不同的地方就是计算次序不一样。所以,当计算TPM的时候,先对基因长度进行归一化,其次是测序深度的归一化。然而,归一化次序不一样,对结果影响差别就很大。当使用TPM时候,每个样本的TPM总和是一样的(=10^6)这使得比较同一个基因的reads数在不同样本间的比例变得容易。FPKM和RPKM与此相反,每个样本的FPKM或RPKM的累加和可以不一样,造成样本间不能直接比较FPKM或RPKM值。

    相关文章

      网友评论

        本文标题:RPKM、FPKM、TPM的区别

        本文链接:https://www.haomeiwen.com/subject/ptjsfdtx.html