Section1 Introduction
结合本书中的Section1以及近期所读的《人工智能在新药发现中的应用进展》--黄芳,首先我们要总结出drug discovery的大体流程,然后再是每一个步骤中AI所能赋能的点。药物发现流程包括:
- 靶点发现:即发现导致疾病发生的关键基因/蛋白;至于筛选的方法可以利用大规模疾病相关的基因库/蛋白进行筛选(二分类有监督建模,自编码特征提取),也可以从疾病相关的海量文献中进行筛选(NLP)
-
- 化合物筛选:针对某一特定基因/靶点/蛋白,从中筛选出与之具有高度亲和力以及结合能力的化合物。这个部分,涉及到的问题和方面比较复杂:
- 2.1. 针对某一基因,要得知该基因所产生靶蛋白的结构,后续才能够基于靶蛋白的结构去筛选与之具有高亲和力的化合物。基因---氨基酸--蛋白结构:核心就是基于氨基酸序列去预测蛋白结构,而Alphafold2在该方面取得了重大突破。
- 2.2. 针对某一个已知的靶点/蛋白,这样的靶点或蛋白本身在自然界可能具有相应的配体,例如VEGFR和VEGF,PD-1和PD-L1;因此我们可以基于靶点/蛋白及其配体自身的蛋白结构数据、二者结合相关的物化数据筛选出能够与二者之一竞争性结合的化合物,达到治疗目的。
- 化合物合成/设计:化合物的合成/设计与化合物筛选所需的步骤类似,只不过一个是按需从已知化合物中去选;另一个是按需去设计一个全新的化合物
Section1 Introduction:本文的内容安排
- Section 2: 利用AI分析chemical data 和 文献/专利中的非结构化数据,主要用到的方法是NLP;应该主要是上述
- Section3:基于配体的预测模型 和Section4:以结构为基础的预测模型 属
- Section5分子设计和Section6合成设计属
- Section7介绍了一款全流程的drug discovery软件
- Section8进行了总结
药物研发过程详解_目前最为清楚
药物研发过程
药物研发过程_知乎
药物研发中的人工智能
网友评论