美文网首页湿实验转录组
【一文读懂生物学重复与技术重复】

【一文读懂生物学重复与技术重复】

作者: 陈有朴 | 来源:发表于2022-02-28 22:23 被阅读0次

在RNA-Seq等测序设计中,生物学重复和技术重复,是非常需要注意的问题。

那么问题就来了,生物学重复和技术重复,到底是什么?它们是如何影响我们的实验设计的。

生物学重复(biological replicate):可以理解为我们对一个群体进行研究,但是我们不会对整个群体进行检测(考虑到成本和工作量的问题,我们肯定也不会采取这种地毯式的方法),只是抽取群体中的一部分进行检测,用样本来代表总体。

这边样本个数,实际上就是生物学重复数。

技术重复(technical replicate):对一个样本的数值进行多次测定。

下表给出常见实验对应重复类型:

image.png

实例

Replication这篇文章以测定小鼠肝脏细胞中的某一个gene的表达量为例,展示了什么是生物学重复和技术重复以及如何权衡这两者之间的关系。

分别给出3种类型的重复,分别为:
(1)animal水平的重复
(2)cell水平的重复
(3)技术重复

image.png

由上图可以得到,3种不同种类的重复,所计算出来的表达量方差是不一样的,但gene表达量的总方差,可以有下列公式计算得到:

σ_{TOT}^2 = σ_{A}^2 + σ_{C}^2 + σ_{M}^2

接下来,将总体的重复次数限定,即在满足n_{A}*n_{C}*n_{M}=48的前提条件下,对Var(X)进行计算。

n_{A}代表动物样本数,n_{C}代表细胞样品数,n_{M}代表技术重复次数,Var(X)是基因表达量误差

Var(\overline{X})Var(X)的变式,含义是the precision in the expression mean,计算公式为\frac{σ_{A}^2}{n_{A}} + \frac{σ_{C}^2}{n_{A}n_{C}} + \frac{σ_{M}^2}{n_{A}n_{C}n_{M}}

1、当n_{A}n_{M}均为1,n_{C}为48的情况下,计算出来的Var(X)如下图标记:

image.png

这种情况下,只反映了由于cell样品重复和技术重复所引起的基因表达量误差。当n_{A}=1(动物样品数为1),即无法计算由于animal样品数变化,所带来的基因表达量误差。

因此在上述情况下,σ_{TOT}^2(Var(X))就被低估了。

2、当n_{A}n_{C}均为1,n_{M}为48的情况下

计算得到的基因表达量误差完全是由于技术重复所引起的。因此,如果我们将这种情况下的误差,认定为由生物重复所引起的,就造成了假阳性。

作者在文章中,还指出了非常重要的一点:虽然增加技术重复,可以让我们对σ_{M}^2有一个更准确的估计,但是没必要。因为提升动物样品数,可以使σ_{M}^2可忽略不计(以Var(\overline{X}))。

同时,需要注意的是,将是样品放入同一批次进行测序,减少批次效应对数据的影响。

同样地,每一种重复对于真实基因表达量的方差贡献也不是相同的。

因为cell重复和测定技术重复,并是一个独立变量。技术重复本质上是对同一份样品进行测定,数据在这种情况下的变异,完全是由于人为或机器造成的,而cell重复在本质上可以认为与animal样品之间存在相关性,因此也不是独立的。

3、从Var(\overline{X})的角度,来选择replicate

【标注】Var(\overline{X})越小,代表对Var(X)估计越准确

image.png

可以看到的是,当增大animal重复数时,Var(X)趋于一个稳定值,该样本对总体的估计达到了一个较为准确的水平,同时Var(\overline{X})的值也接近于0。

4、从统计检验的角度,来选择replicate

使用two-sample t检验,来判断cell样品的gene表达量方差、动物样品表达量均值之间是否存在显著差异。

下图很明显的一个结果就是,随着n_{A}的增加,统计检验的效能得到提升,假阳性也在降低(同时也得权衡n_{A}n_{B}

总结

对于一组数据来说,研究对象的生物重复比技术重复更能够反映总体,因此在进行实验设计时,最好将实验/测序资源倾向这边,而不是技术重复(除非对技术重复所诱发的影响感兴趣)

参考资料

[1] 刘小乐老师-哈佛计算生物学与生物信息学
[2] Blainey P, Krzywinski M, Altman N. Points of significance: replication[J]. Nature methods, 2014, 11(9): 879.

相关文章

  • 【一文读懂生物学重复与技术重复】

    在RNA-Seq等测序设计中,生物学重复和技术重复,是非常需要注意的问题。 那么问题就来了,生物学重复和技术重复,...

  • 转录组测序中生物学重复如何来设

    1.区分生物学重复与技术重复 生物学重复:指样本重复,比如3只小鼠,同时做一种处理,就是三个生物学重复。 技术重复...

  • 生物学重复与技术重复

    生物学重复与技术重复 在利用基因芯片或者RNA-seq做基因表达分析的时候,经常听说生物学重复和技术重复,这篇文章...

  • 【转载】生物学重复与技术重复

    生物重复和技术重复分别是什么?在一个实验中应该如何安排生物重复和技术重复?重复是实验设计的重要原则之一,实验重复无...

  • 2、StatQuest学习——样本量与重复

    1.技术重复和生物学重复及其他重复 技术重复 通过技术重复,我们可以更精确的测量这位仁兄基因的表达,如果每次技术重...

  • 生物学重复与技术重复区别

    生物学重复是指不同生物个体或者不同生物群体的样品之间进行地相同处理而进行的实验,而技术重复是指同一样品进行的多次相...

  • 技术重复和生物学重复

    1.技术重复 同一个样品测多次。例如给某伙计取血样,测5次基因表达量 能得到的信息 1.这伙计精确的基因表达量2....

  • 19高通量测序-RNA-Seq中的技术重复问题

    RNA-Seq中的技术重复问题 在RNA-Seq中我们是否需要技术重复?如果我们有生物学重复就不需要技术重复。为什...

  • 由生物学重复引发出来的思考

    太长不看系列 技术重复:一个样本重复多次 生物学重复:同一批次每个生物重复一次(多次) 当生物学重复之间存在相关性...

  • 怎么区分生物学重复与技术重复

    很长一段时间里发现一个问题,在平常的实验过程中,有一些童鞋还是会对生物学重复和技术重复有一些混淆,今天我们彻底再重...

网友评论

    本文标题:【一文读懂生物学重复与技术重复】

    本文链接:https://www.haomeiwen.com/subject/nnurrrtx.html