姓名:付盼龙
转载至人工智能观察
【嵌牛导读】今天,距科学家首次对人类基因组进行测序已有15年之久,但是对人类来说,理解编码生命的海量基因数据仍是一个巨大的挑战。但是,不得不说,这正是机器学习所擅长的领域。本周一,谷歌发布了一款名为DeepVariant的工具,旨在利用最新的人工智能技术,从测序数据中构建出一个更精准的个人基因组图谱。
【嵌牛提问】未来AI可以用于医学吗?
【嵌牛鼻子】人类基因组 图谱
【嵌牛正文】
DeepVariant有助于将高通量测序(high-throughput sequencing;HTS)的读数转化为完整的基因组图片。此外,它还能自动识别出在测序数据中插入和删除的突变或单碱基对突变。
突破传统方式测序不完整等问题
高通量测序在2000年初得到广泛应用,并使基因组测序变得更加容易。
但是,高通量测序出来的结果不是完整的,而是碎片化的片段信息。对科学家来说,将小的突变与在测序过程中产生的随机错误区分开来是很困难的,尤其是在基因组的重复部分。这些突变可能与癌症等疾病直接相关。
实际上,有许多的工具可以用来解释这些读数,比如GATK, VarDict和FreeBayes。然而, 这些软件程序通常使用更简单的统计和机器学习的方法来识别突变,尝试排除错误信息。
哈佛大学公共卫生学院的研究科学家Brad Chapman表示:“我们面临的挑战之一也是基因组的困难部分,每种工具都有各自的优点和缺点。”Brad Chapman曾对早期版本的DeepVariant进行过测试。“这些困难部分对临床测序越来越重要,通过多种方式对其进行检测,也是很重要的。”
谷歌医疗新突破:AI工具可将基因组信息转化为癌症治疗方法 “DeepVariant”是由Google Brain团队的研究人员联合同属于Alphabet旗下的生命科学兄弟公司Verily,用了两年多时间开发出来的。Google Brain团队专注于开发和应用人工智能技术,而Verily则专注于生命科学的研究。这个团队从瓶中基因组联盟(Genome in a Bottle;GIAB)项目中收集了数以百万计的高通量读取和全测序基因组。GIAB是一个公私合作的项目,目的是促进基因组测序工具和技术的发展。
他们将数据输入到一个深度学习的系统中,并煞费苦心地调整模型参数,直到它学会以较高的紧缺度来解释序列数据。
“DeepVarient的成功是很重要的,因为它表明,在基因组学中,深度学习可以被用来自动训练比复杂的手工程系统更好的平台。”Deep Genomics公司的首席执行官Brendan Frey说道。
DeepVariant的发布是机器学习有望促进基因组学发展的最新迹象。
Deep Genomics是尝试通过人工智能方法,比如深度学习,来识别疾病的遗传原因并寻找潜在的药物疗法的众多公司之一。
人工智能将帮助医生突破医学鸿沟
Frey表示,人工智能最终将远远超越基因组数据的序列。他说:“目前阻碍医学的鸿沟在于我们无法准确地将基因变异与疾病机制进行精确的映射,并利用这些知识快速识别出拯救生命的治疗方法。”
这一领域的另一家知名公司是明码生物科技(Wuxi Nextcode),它在上海、冰岛、剑桥和马萨诸塞州均设有办事处。Wuxi Nextcode已经积累了世界上最大的人类基因组序列,而且该公司正在大力投资机器学习。
谷歌医疗新突破:AI工具可将基因组信息转化为癌症治疗方法 另外,DeepVariant 也可以在谷歌云平台上使用。谷歌及其竞争对手正疯狂地向其云平台添加机器学习功能,来吸引任何可能想要利用最新人工智能技术的人。总的来说,在未来的几年里,人工智能将帮助医学的许多领域产生巨大的进步。我们有机会从图像或医疗记录中挖掘出更多不同种类的医疗数据,比如,预测人类医生可能会错过的疾病。
网友评论