噬菌体、病毒研究者的烦恼
1. 病毒与噬菌体分离麻烦,宿主污染严重,数据浪费
2. 基因注释信息缺失,大量未知功能的ORF
3. 想开展溶原性、烈性噬菌体研究,不知如何下手
4. 噬菌体作为一种天然的病原细菌抗生素,前景广阔,是否存在大规模筛选工具?
问题一堆一堆,何处入手?
我们以一篇宏病毒文献为例,寻找破局之道
→分为四步
1、抓基础、重基础:收集现有数据
国内大部分研究者对于生物数据库的理解都停留在使用层面,例如常见的NCBI BLAST页面
然而,我们常常忽视数据库整体的状态更新与特色。想建大厦,从基础抓起!
研究的第一步在于收集已有数据,并对已有的病毒完成图进行分类统计。
(1)NCBI RefSeq:< 9000病毒完成图
(2)ICTV:病毒物种分类国际权威数据库
2、找研究重点与Unique Idea
核心思路:自我简化
从上图统计可以看到,按照各种分类标准,病毒可以分为很多类型。此时,如果想一网打尽,那么几乎没有合适的研究手段,很多人在这里被卡住了。。。
简化方式:
(1)只关注带有衣壳蛋白的病毒——表面活性剂可以富集
(2)只关注单链环状DNA病毒——外切酶除去双链DNA,RNA酶去除所有RNA,剩余环状ssDNA后,样品组成得到极大的简化
(3)phi29特异性地对ssDNA进行滚环扩增,获得双链DNA,可以直接进行NGS测序。MetaSPades组装后,获得>2500个单链环状DNA完成图,绝大部分都小于10kb。
3、高级分析
高级分析不能贪多,国内很多研究者初期都有非常棒的研究结果。有时为了追求完美,单纯为了增加研究内容,会错失时机,同时也会严重降低文章研究主旨,得不偿失。
(1)用衣壳蛋白的差异性进行物种分类
(2)物种分类重新统计数据
(3)寻找以上两者关联
4、主题升华
宏基因组公共数据特别多,找几个作为案例证明:
(1)分析流程的可靠性
(2)获得的2500个完成图存在的广泛性
彩蛋——笔者感想
回帖率:宏基因数据中,reads回帖率比较低,即组装获得的序列还是非常不完整。
在BGI最新研究成果的帮助下,依靠培养组学的技术,暴力解析了kb级别的细菌基因组后,肠道回帖率从50%增加到70%以上,是个非常大的进步。
然而,环境样品没有这么好的运气可以如此暴力破解,因此该研究的意义特别巨大。
我们可以通过实验技术的简化,针对性地解析部分物种,进而获得全貌。日拱一卒无有尽,功不唐捐终入海
欢迎一起讨论关于病毒、宏病毒研究方案!
参考文献:Discovery of several thousand highly diverse circular DNA viruses. bioRxiv, 2019.
网友评论