简写
RPKM: Reads Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的reads)
FPKM: Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments)
RPM/CPM: Reads/Counts of exon model per Million mapped reads (每百万映射读取的reads)
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)
RPKM
RPKM--代表每百万reads中来自于某基因每千个碱基转录得到的reads数。是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)之和。
RPKM计算公式total exon reads:样本中某个基因mapping到外显子上的所有的reads数
mapped reads (Millions) :样本总reads数
exon length(KB):某个基因的长度(外显子长度的总和,以KB为单位)
RPKM公式简化FPKM
FPKM与RPKM计算方法基本一致。FPKM 计算的是DNA片段(fragments),也就是一对reads。与RPKM 的差别主要体现在,FPKM在一对reads map上的情况下只计数1,而RPKM 会计为2。适用于双端测序。
FPKM计算公式在单端测序中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;
在双端测序中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。
总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。
FPKM(RPKM)适用于:同一个样本中基因A和基因B的相对表达量
TPM
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)
TPM计算公式Ni:比对到第i个exon的reads数
Li:第i个exon的长度
sum(N1/L1+N2/L2 + ... + Nn/Ln):所有 (n个)exon按长度进行标准化之后数值的和
TPM其实跟RPKM,FPKM也很相似。TPM唯一不同的地方就是计算次序不一样。所以,当计算TPM的时候,先对基因长度进行归一化,其次是测序深度的归一化。然而,归一化次序不一样,对结果影响差别就很大。当使用TPM时候,每个样本的TPM总和是一样的(=10^6)。这使得比较同一个基因的reads数在不同样本间的比例变得容易。FPKM和RPKM与此相反,每个样本的FPKM或RPKM的累加和可以不一样,造成样本间不能直接比较FPKM或RPKM值。
网友评论