美文网首页
2022-05-22

2022-05-22

作者: 图灵基因 | 来源:发表于2022-05-22 22:13 被阅读0次

    Nat MI | GPU计算和深度学习在药物发现中的推动作用

    原创 风不止步 图灵基因 2022-05-22 21:24 发表于江苏

    收录于合集#前沿生物大数据分析

    撰文:风不止步

    IF=16.649 

    推荐度:⭐⭐⭐⭐⭐

    亮点:

    文章概述了图形处理单元(GPU)算法的历史趋势和最新进展,并讨论它们对发现新药和药物靶点的直接影响。介绍最先进的深度学习架构,这些架构已在早期药物发现和随后的先导优化阶段得到实际应用,包括加速分子对接、评估脱靶效应和药理性质的预测。

    2022年3月23日,英国哥伦比亚大学的Artem Cherkasov博士等人在《Nature machine intelligence》上发表了一篇“The transformational role of GPU computing and deep learning in drug discovery”的文章,文章讨论GPU支持的并行化和标准深度学习(DL)模型开发和应用对蛋白质和蛋白质-配体复合物模拟的时间尺度和准确性的影响。提供用于低温电子显微镜 (cryo-EM)中的结构确定和蛋白质3D结构预测的DL算法示例。

    GPU最初是为加速3D图形而开发的,强大并行计算的好处很快得到了科学界的好评。2007 年,NVIDIA发布了计算统一设备架构(CUDA)作为C编程语言的扩展,以及编译器和调试器,打开将计算密集型工作负载移植到GPU加速器的闸门。进一步的发展来自于常见数学库的发布,例如作为快速傅立叶变换和基本线性代数子程序等。同年,第一个计算化学程序被移植到GPU,实现分子力学和量子蒙特卡罗计算的高效并行化。

    2014 年9月,NVIDIA发布了cuDNN,这是一个用于深度神经网络 (DNN) 的GPU加速原语库,实现标准例程,例如前向/后向卷积、池化、归一化和激活层。GPU支持的训练和测试子流程的架构支持似乎对标准深度学习(DL)程序特别有效。因此,出现一个由GPU加速的DL平台组成的完整生态系统。虽然NVIDIA的CUDA是一个更成熟的GPU编程框架,但AMD的ROCm代表一个用于GPU加速计算的通用平台。ROCm引入了新的数值格式来支持常见的开源机器学习库,例如TensorFlow和PyTorch,它提供将NVIDIA的CUDA代码移植到AMD硬件的方法。

    生物信息学、化学信息学和化学基因组学领域,包括计算机辅助药物发现 (CADD),利用在GPU上运行的深度学习方法。CADD中的大多数挑战通常都面临组合学和优化问题,而机器学习已经有效地为它们提供了解决方案。因此,DL在CADD应用中取得重大进展,例如虚拟筛选、从头药物设计、吸收、分布、代谢、排泄和毒性(ADMET) 特性预测等。

    现代药物发现受益于最近DL模型和GPU并行计算的爆炸式增长。在硬件进步的推动下,DL在从虚拟筛选和QSAR分析到生成药物设计的药物发现问题上表现卓越。特别是从头药物设计一直是GPU计算进步的主要受益者之一,因为它利用大容量和高度参数化的模型,例如VAE和GAN,如果不使用GPU等硬件加速器,这些模型就无法合理部署。近年来,GPU硬件的性价比不断提高,DL对GPU的依赖,以及DL在CADD中的广泛采用,这些都可以从CAS内容库中超过50%的 "化学中的人工智能 "文献中看出。此外,混合人工智能方法已经被采用,它结合传统的分子模拟和DL,用于快速和准确地筛选接近数千亿分子的超大型化学库。

    DL算法的另一个关键驱动因素是“大数据”的可用性。随着基因测序和高通量筛选越来越容易,数据驱动的计算化学研究人员现在可以轻松获得大量原始数据。然而,对监督学习方法至关重要的高质量标记数据的管理成本仍然很高。建立在从辅助数据集中学习的方法、使用迁移学习的知识转移和零样本学习等标签保守方法因此成为药物发现的DL的核心部分。为发现药物而开发的任何深度学习方法的可靠性和普遍性都取决于源数据的质量。因此,数据清理和管理有重要作用,可以单独定义此类DL应用程序的成功或失败,因此,深入探索集中、处理和标记良好的数据存储库的假定优势仍然是一个开放的研究领域.

    总体而言,药物发现和机器学习领域的研究人员有效地合作识别CADD问题和相应的DL工具。相信未来几年这些应用程序将得到微调和成熟,这种合作将进一步发展到生命科学的其他未开发领域。

    教授介绍

    Artem Cherkasov博士

    Artem Cherkasov 博士是不列颠哥伦比亚大学医学院泌尿科学系的教授,也是温哥华前列腺中心的高级科学家。研究兴趣包括计算机辅助药物发现 (CADD)、结构活性建模、药物重新分析、新的癌症治疗方法的发现以及新的CADD工具和应用程序的开发。

    Cherkasov博士与他人合著了200多篇研究论文、80项专利申请和几个著名的书籍章节。2017 年,Cherkasov博士带领10位杰出的PI成功向加拿大创新基金会申请2400万美元,以在UBC创建一个完整的ADDUCT(使用临床翻译加速药物发现)基础设施。这些赠款通过最新的冷冻电镜技术、增强的蛋白质生产和纯化能力以及大量的计算基础设施完善了 UBC 跨学科药物发现平台,为个性化药物发现提供了尖端的CADD和AI支持。

    为应对全球COVID-19大流行,Cherkasov博士的团队利用他们基于AI的新型平台Deep Docking (DD),以及最近发布的COVID-19 Mpro目标结构,将DD应用于处理13亿种化合物;在一周内,他们确定与科学界共享的前1000个潜在配体。继续将其缩小到可能导致治疗的前100种候选蛋白酶抑制剂的候选名单,并与合作者一起及时筛选,以加速通过VPC已建立的药物开发管道的顶级候选药物。

    Cherkasov 博士还获得NSERC、CIHR、加拿大前列腺癌、BC省前列腺癌基金会、美国国防部、加拿大癌症研究所和NIH等的多项研究资助。2022年1月,他被任命为加拿大精准癌症药物设计一级研究主席。

    参考文献

    Mohit Pandey, Michael Fernandez et al.Thetransformational role of GPU computing and deep learning in drugdiscovery(2022)

    相关文章

      网友评论

          本文标题:2022-05-22

          本文链接:https://www.haomeiwen.com/subject/zyslprtx.html