1990年提出的人类基因组计划带我们进入了基因组时代,甚至在基因图谱绘制完成后(之前写过两篇关于基因组相关内容的文章,【现学现卖】基因图谱概述和【现学现卖】基因图谱之物理图),进入了后基因组时代(功能基因组学等的研究)。
人类基因组是第一个已经完全测序的脊椎动物基因组,这项巨大工程揭示了人类的遗传组成以及基因组进化的大量信息。通过与其他已经测序的脊椎动物基因组学列的比较,我们有了一些意外的发现,对自己的理解也进一步加深了。
首先,人类基因数目少于预期。现在认为我们有20000-25000个基因,和小鼠相似(20000-25000个,哺乳动物基因组变化一般较小),远小于水稻(40000个)等植物。而且人类基因组中基因家族数目和其他真核生物的差异不大。
人类基因组没有增加大量的基因来完成复杂的生命活动、构成人体,也是因为人类基因组中可变剪接,可变启动子选择等特别多,约60%人类基因可能存在可变剪接。
随着测序基因完成,生物学和医学等领域的发展更为迅速。但是人类基因组测序真的完成了吗?
截至2003年底,绝大部分的人类基因组已获得测定;但基因组中仍有许多的区域未获得测序。
这其中的首要原因是基于染色体结构或者重复基因的存在,测定比较全面的是常染色质。而对于异染色质,比如在每条染色体的中心区域(称为着丝粒)和染色体末端区域(称为端粒),用目前的技术进行测序的难度较大。因为在异染色质中,有很多重复的基因(重复序列以多拷贝存在,占人类基因组50%以上),是一个巨大的挑战。由于基因组测序是将无数短片段进行拼接,所以如果重复序列太多,就很难定位,好似在拼一个纯色的拼图。
另外一个原因是基因组中有一些包含多基因家族成员的位点,基于短片段拼接的方法,这些位点的准确测序问题难以解决,而包含于这些位点中的多基因家族成员往往编码具有重要免疫功能的蛋白质。
最近一项研究首次获得了一条染色体的完整序列,科学家“从头到尾”(从端粒到端粒)确认了人类X染色体的完整序列,其中不存在任何缺口,它的精确度达到了前所未有的水平。这一成果也标志着,创造出精确到碱基的完整人类染色体已经成为现实,基因组学研究或许将迈入新的时代——一个完整基因组序列的时代。
研究使用纳米孔测序(【现学现卖】实验-DNA测序之前的推送有所提及),获得超长reads,连续性、完整性、准确性都有所提高。而后团队在三个不同的测序平台上使用了一种迭代过程来完善序列,并达到了高精度的水平。
作者Miga表示:“之前参考序列中存在缺口的区域,实际上是人类种群变异最为丰富的区域之一。因此,我们一直缺少的信息可能对理解人类生物学和疾病至关重要。”
参考文献
Miga, K.H., Koren, S., Rhie, A. et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature (2020). https://doi.org/10.1038/s41586-020-2547-7
Krebs, J. E., Goldstein, E. S., & Kilpatrick, S. T. (2009). Lewin's genes X. Jones & Bartlett Publishers.
网友评论