假设我们有一些来自微阵列实验的数据
如果你不熟悉微阵列,这里有解释:
-
微阵列测量样本中基因的活性。
-
他们通过测量不同颜色的光的强度来做到这一点。
-
如果你在一个实验中有一个更好的灯泡,那么每个测量结果都可能比另一个实验的结果更大。
因此,我们需要标准化数据来解释实验之间的技术差异,这与生物学无关。
这是我们的数据。在这张图中,每种颜色代表一个不同的基因。这些颜色与实际微阵列实验中扫描到的颜色不同。此时,那些颜色已经转换为强度值。每个样本都有不同的平均值,这表明我们需要对不同的整体光强进行补偿。分位数标准化(Quantile Normalization)纠正了这个技术。
-
先关注每个样本中表达最高的基因
-
然后计算三个样本中表达最高基因的平均值
-
表达量最高的基因的分位数归一化值为其平均值
-
现在把注意力集中在每个样本中第二个高表达基因上,重复步骤1-3,知道标准化所有基因。
分位数标准化(Quantile Normalization)后,每个样本的值都相同,但是原始的基因顺序被保留了下来。他们称之为“Quantile Normalization”,因为标准化的数据集有分位数相同。
网友评论