limma

作者: 一路向前_莫问前程_前程似锦 | 来源:发表于2020-06-23 10:25 被阅读0次
    • limma的输入表达矩阵要求是经过log2处理之后的
      GEO中的Series Matrix File(s)通常是经过了标准化和对数转换的数据。但不全是。在实际应用的时候需要根据情况判断一下。对于芯片数据,可能作者将.cel的文件处理成未标准化的数据直接上传。一般来说,在判断counts是否需要重新标准化以及是否需要log2时,可以根据数值大小粗略估计。

    如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。因为2的几十次方已经非常巨大,如果2的几百次方,则不符合实际情况。
    对于是否需要标准化的问题,可以通过boxplot函数观察一下样本表达丰度值的分布是否整齐进行判断。
    所以 TMM,TPM等最后先log2处理之后,才可以用limma处理差异

    通常使用limma处理时,需要经过log2后的矩阵作为表达矩阵输入。根据log2FC的定义,这个数字表示变化倍数经过log2后的一个值,比如log2FC=1,则变化为2倍;log2FC=2,则变化为4倍。这是常用的一种表述方法。

    在使用limma函数计算时,如果输入的矩阵没有经过log2处理,则会把FC当成log2FC输入,这或许是因为limma默认输入的是log2后的表达式。这里有必要提到log的一个运算,即对于已经log2后的数据,计算log2FC = log2(A/B)只需要直接使用log2A-log2B。所以如果给出的是一个未经log2的数值,函数也会直接相减以得到log2FC,这就导致计算出来的差异表达高达几百甚至上千。

    并且,通过RMA法进行预处理时,已经经过了log2。

    https://blog.csdn.net/tuanzide5233/article/details/83541443

    相关文章

      网友评论

        本文标题:limma

        本文链接:https://www.haomeiwen.com/subject/rypcfktx.html