化合物(compounds)药物是一种主要的药物类型,通常进行相关研究时通常需要对其结构进行操作,展示,及分子量,化学描述符等计算。这里介绍一个操作简便友好的开源工具,RDKit。
RDKit是一个用于化学信息学的开源工具包,基于对化合物2D和3D分子操作,利用机器学习方法进行化合物描述符生成,fingerprint生成,化合物结构相似性计算,2D和3D分子展示等。基于PYTHON语言进行调取使用。
该工具官网:https://rdkit.org
也可以根据从 The RDKit Documentation 网站进入了解RDKit并熟悉RDKit的指令操作。
以下介绍RDKit的一些基础操作。
from rdkit import Chem
# 读化合物分子·example
m = Chem.MolFromSmiles('Cc1ccccc1') #读取Smiles
m = Chem.MolFromMolFile('data/input.mol') #读取.mol文件
stringWithMolData=open('data/input.mol','r').read()
m = Chem.MolFromMolBlock(stringWithMolData)
# 写化合物分子·example
m = Chem.MolFromMolFile('data/chiral.mol')
Chem.MolToSmiles(m) # 结果显示: 'C[C@H](O)c1ccccc1'
Getting Started with the RDKit in Python
- Important note
- What is this?
- Reading and Writing Molecules
- Working with Molecules
- Substructure Searching
- Chemical Transformations
- Maximum Common Substructure
- Fingerprinting and Molecular Similarity
- Descriptor Calculation
Getting Started with the RDKit in Python — The RDKit 2022.03.1 documentation
网友评论