随着单细胞技术的发展和成本的下降为构建大型单细胞图谱提供了机会,其实人们已经这样做了,如小鼠单细胞图谱(http://bis.zju.edu.cn/MCA/ ,40W+)和人类单细胞景观(http://bis.zju.edu.cn/HCL/ ,70W+)。能在单细胞水平上解析某一物种细胞类型的异质性,这将为该物种的基础研究和产业应用提供基础材料。这让我想起2003年那场【中日“家蚕基因”科技战】(尽管那一年我才12岁_)。
中国有着悠久的栽桑养蚕历史,虽然现代蚕业技术体系为日本建立,改革开放后我国的蚕业也得到了长足的发展。2001年,日本在法国里昂召开国际鳞翅目昆虫基因组计划筹备会,宣布家蚕基因组国际合作组织开始启动。而作为蚕丝产量已经占世界总量70%的中国,却没有被邀请参会,这意味着我国家蚕产业在基础研究中将会再次受制于人。在向日本提出合作未果后,经过两年多的努力,向仲怀院士团队启动了中国家蚕基因组计划,并于2003年11月15日宣布:我国已率先完成家蚕基因组“框架图”绘制工作。这标志着我国在家蚕基因组研究方面已居世界领先地位,也是建立21世纪‘丝绸之路'的起点和里程碑(向仲怀语)。
这是我国科学家继完成人类基因组1%测序工作、水稻基因组“框架图”和“精密图”之后,向人类贡献的第三大基因组研究成果。自此,我国成为家蚕研究国际队伍中不可或缺的一员,也是国际同行的重要合作伙伴。
历史何其地相似。在基因组时代,哪个实验室率先绘就了基因组图谱,哪里为该物种提供了基因组资源,哪里就成为后基因组时代中该物种研究的新领地。如今,哪里率先完成某器官,某癌肿,某物种单细胞图谱的构建,在将来后单细胞时代也会成为该器官(发育与疾病研究),该癌肿,该物种研究的新领地。同时,目前正在进行的人类细胞图谱计划和1990年的人类基因组计划又是何其的相似,也是多国合作提供该研究的基础资料。
未来一段时间内,会有更多的单细胞图谱计划推出和实施,一如1990年以来的基因组计划:以人类图谱为引领众多图谱计划并行推进。因为在技术上已经允许了,只是成本问题。历史只会发生故事,不会选择故事的当事人。也就是是说,家蚕基因组我们不做,有人来做;家蚕单细胞图谱我们不做,也有人来做。谁来做这件事,谁就可以以此参与到历史事件之中。构建大型单细胞图谱是在响应生命科学研究范式的转变:走向生物大数据时代。
如果我们选择了这种担当,想要在这宇宙中留下痕迹。选择为自己的同行提供研究材料的单细胞图谱,我们将会面临哪些问题,谁又能成为合作伙伴呢?
机会如上所述,挑战如下。
首先明确一下什么叫大型单细胞图谱,主要的区别是数量上的,区别于测三五个样本获得三五万个细胞的研究型图谱。大型单细胞图谱在这里指的是就某一器官,某一疾病,某一物种的大规模的单细胞转录组测序(细胞数20W+)。
- 实验材料
既然需要构建目标物种的单细胞图谱,肯定需要广泛的材料。这一点和基因组还有很大区别的,因为基因组在个体水平基本是稳定的而转录组因组织发育不同而不同。在实验材料的处理保存等方面会带来一些挑战,时间点如何截取?不同样本如何保存以便展开组织解离测序?
- 组织解离
实验材料方面的挑战其实主要是转录组特定的,而组织解离则是单细胞研究独特的挑战。同一个物种不同组织往往有着很大的异质性,如人的肝脏和皮肤,不同的组织往往需要不同解离手段以获得单个细胞。这时候可能需要课题组协同作战,按组织类型组织作战小分队,分别研究解离方法,加之已经成熟的商业解离解决方案,缩短组织解离和细胞消化的周期。
- 建库测序
这部分其实已经不成为挑战了,测序技术已经十分成熟。主要需要考虑的是避免在测序这里引入技术噪音,也就是尽量保持测序平台的统一。
- 数据分析
目前单细胞图谱细胞数大部分小于五万,所以所提供的分析工具在计算性能上也默认是这个数量级。细胞数达到20W以上之后许多分析工具将不能胜任。第二点是,一个物种的单细胞图谱往往不能同时测量,如何将它们整合到一起。好消息是,这两个挑战都在慢慢解决。已经有大型单细胞数据集数据分析的工具,主流的单细胞分析工具如Seurat scanpy scenic 等都在不断优化自己的性能以适应不断提高的单细胞数据通量。数据的整合也不像2017年那时候没有可以选择的工具,目前至少不需要重新开发新的工具就可以展开这项工作了。
数据分析之后,大型细胞图谱往往会选择用在线数据库的形式展示数据资源以供同行查询挖掘,当然,在互联网时代的今天也不成为挑战了。
- 钱
评述略。
构建人类细胞图谱,国际上用的是多家单位协同作战。我们也可以充分发挥自身的条件,利用我们研究材料丰富和人员组织的优势,克服以上挑战。基础研究薄弱是发展中国家普遍面临的困境,但是今天我们也有着自己的优势:生命科学科技服务相对完整的产业体系。
网友评论