RPKM, FPKM以及TPM

作者: 斩毛毛 | 来源:发表于2020-09-23 10:21 被阅读0次

    简单概念

    • RPKM (Reads Per Kilobase Million 每千碱基百万个读数)
    • FPKM (Fragments Per Kilobase Million 每千碱基百万个碎片)
    • TPM (Transcripts Per Kilobase Million每千碱基记录本)

    其中当为single-end 测序,RPKM 与 FPKM 是等价的

    计算方法

    • RPKM/FPKM

    其中心思想即是由于基因长度,以及测序深度的不同,导致每个基因在每个样本中得到的reads count必须经过一定的标准化;因为深度约深,基因长度越长, 所得到的reads count越多,这在统计学上是不合理的,因此需要标准化。

    上述存在两个变量,即基因长度, 测序深度,因此,将获得的reads count 依次除以 测序深度,基因长度,即同时比较在每1Kb 每百万reads情况下的reads count。

    RPKM/FPKM 首先除以测序深度,而后在除以基因长度。
    ** 注意均以1kb,即百万为一个单位。

    • TPM

    相对于上述两种情况,TPM 计算的顺序不同。

    先以基因长度进行标准化,即mapped reads count / length(kb)

    而后以得到的结果计算all reads/1000000(百万为一单位), 然后在除以all reads即可得到TPM值。

    实则TPM即是 RPKM的百分比;
    比如:有3个基因(A,B,C) RPKM分别为 12,32,41
    则 A基因的TPM为 12*1000000/(12+32+41), 因此每一个样本的TPM 值之和均等于1000000。

    通过RPKM 也可计算TPM,具体可查看What the FPKM? A review of RNA-Seq expression units

    参考

    相关文章

      网友评论

        本文标题:RPKM, FPKM以及TPM

        本文链接:https://www.haomeiwen.com/subject/jhhgyktx.html