美文网首页RDKit | 操作与实践
RDKit|分子修改与编辑

RDKit|分子修改与编辑

作者: 最会设计的科研狗 | 来源:发表于2020-05-24 15:46 被阅读0次

    文章目录

    • 一、初级篇
    1. 氢原子显示与隐藏
    2. 芳香键与kekule式转换
    • 二、高级篇
    1. Atom和Bond对象的编辑功能
    2. RWMol类的编辑功能

    一、初级篇

    1.氢原子显示与隐藏

    正常情况下,分子在rdkit中存储时,氢以隐式氢的形式存储,即不会在图片中显示出来。当需要加入氢原子时,例如要生成和优化立体结构,可以通过函数加上氢原子。

    • 加氢:AddHs()
    • 去氢:RemoveHs()
    >>> from rdkit import Chem
    >>> m = Chem.MolFromSmiles('CCO')
    >>> print(m.GetNumAtoms())
    3
    >>> m2 = Chem.AddHs(m)
    >>> print(m2.GetNumAtoms())
    9
    >>> m2 = Chem.RemoveHs(m2)
    >>> print(m2.GetNumAtoms())
    3
    

    2.芳香键与kekule式转换

    • 芳香键在Rdkit中存储类型为"AROMATIC",可以转化为kelule式:Kekulize()
    >>> m = Chem.MolFromSmiles('c1ccccc1')
    >>> print(m.GetBondWithIdx(0).GetBondType())
    AROMATIC
    >>> Chem.Kekulize(m)
    >>> print(m.GetBondWithIdx(0).GetBondType())
    DOUBLE
    >>> print(m.GetBondWithIdx(1).GetBondType())
    SINGLE
    

    转化后,类型中虽然变为单键和双键,但依然是芳香键

    • 查看是否为芳香键:GetIsAromatic()
    >>> print(m.GetBondWithIdx(1).GetIsAromatic())
    True
    
    • 之所以仍然为芳香键,是因为分子有一个跟芳香性相关的属性Flags,记录了芳香性的信息。可以在kelulize时将clearAromaticFlags参数设置为True
    >>> Chem.Kekulize(m, clearAromaticFlags=True)
    >>> print(m.GetBondWithIdx(0).GetBondType())
    DOUBLE
    >>> print(m.GetBondWithIdx(1).GetIsAromatic())
    False
    
    • 如果想修改回芳香键,可以对分子进行检查:SanitizeMol()
    >>> Chem.SanitizeMol(m)
    >>> print(m.GetBondWithIdx(0).GetBondType())
    AROMATIC
    

    二、高级篇

    1.Atom和Bond对象的编辑功能

    在rdkit的Atom对象中也提供了一系列功能,可以对分子进行原位编辑。

    • 修改形式电荷:atom.SetFormalCharge(int)
    • 修改杂化方式为SP3:atom.HybridizationType(Chem.HybridizationType.SP3)
    • 修改为芳香原子:atom.SetIsAromatic(True)
    • 修改为同位素标记原子:atom.SetIsotope(int)
    • 不带隐式氢:atom.SetNoImplicit(True)
    • 固定显示氢:atom.SetNumExplicitHs(int)

    Bond对象类似

    • 修改键的显示方式:SetBondDir(Chem.BondDir.BEGINDASH)
    • 修改为芳香键:SetBondType(Chem.BondType.AROMATIC)
    • 修改键芳香性的Flags:SetIsAromatic(bool)
    • 是否共轭:SetIsConjugated(bool)

    不挨个说明了,感兴趣可以试试各个函数及相关参数,举几个可能会遇到的例子

    • 修改手性碳:SetChiralTag()
      参数设置为Chem.ChiralType.CHI_TETRAHEDRAL_CCW时,为S型(Counter Clockwise,逆时针)
      参数设置为Chem.ChiralType.CHI_TETRAHEDRAL_CW时,为R型(Clockwise,顺时针)
      还有CHI_OTHER、CHI_UNSPECIFIED不指定类型
    >>> m = Chem.MolFromSmiles('OC(N)C')
    >>> m.GetAtomWithIdx(1).SetChiralTag(Chem.ChiralType.CHI_TETRAHEDRAL_CW)
    >>> m
    
    modifying_mols_0.png
    • 修改原子:atom.SetAtomicNum()
    >>> m = Chem.MolFromSmiles('c1ccccc1')
    >>> m.GetAtomWithIdx(0).SetAtomicNum(7)
    >>> Chem.SanitizeMol(m)
    >>> Chem.MolToSmiles(m)
    'c1ccncc1'
    
    • 别忘了检查步骤,虽然有时候看起来没什么问题
    >>> m = Chem.MolFromSmiles('c1ccccc1')
    >>> m.GetAtomWithIdx(0).SetAtomicNum(8)
    >>> Chem.MolToSmiles(m)
    'c1ccocc1'
    
    • 但该分子本身其实是错误的:SanitizeMol()
    >>> Chem.SanitizeMol(m)
    ---------------------------------------------------------------------------
    KekulizeException                         Traceback (most recent call last)
    <ipython-input-80-8aabfab76642> in <module>
    ----> 1 Chem.SanitizeMol(m)
    
    KekulizeException: Can't kekulize mol.  Unkekulized atoms: 1 2 3 4 5
    

    2.RWMol类的编辑功能

    更复杂的操作可以使用rdkit.Chem.rdchem.RWMol类(用于分子读写的类)。这个类在修改分子方面,性能更好,它可以提供一个“活动的”分子,并且共享了mol对象的操作接口。修改完毕后,只需要用GetMol()就可以获得最终的分子

    >>> m = Chem.MolFromSmiles('CC(=O)C=CC=C')
    >>> mw = Chem.RWMol(m)
    >>> mw
    
    modifying_mols_1.png
    • 替换原子:ReplaceAtom(index, newAtom, ...)
      index:要替换的原子索引
      newAtom:新的原子对象
    >>> mw.ReplaceAtom(4, Chem.Atom(7))
    >>> mw
    
    modifying_mols_2.png
    • 添加原子:AddAtom(atom)
      atom:要添加的原子对象
      返回值是新添加原子的索引
    >>> mw.AddAtom(Chem.Atom(6))
    >>> mw.AddAtom(Chem.Atom(6))
    >>> mw
    
    modifying_mols_3.png
    • 添加键:AddBond(beginAtomIdx, endAtomIdx, order)
      beginAtomIdx:键的起始原子
      endAtomIdx:键的末尾原子
      order:键的类型
    >>> mw.AddBond(6, 7, Chem.BondType.SINGLE)
    >>> mw.AddBond(7, 8, Chem.BondType.DOUBLE)
    >>> mw.AddBond(8, 3, Chem.BondType.SINGLE)
    >>> mw
    
    modifying_mols_4.png
    • 删除原子:RemoveAtom()
      传入原子索引
      每次删除后,索引都会更新
    >>> mw.RemoveAtom(0)
    >>> mw
    
    modifying_mols_5.png
    • 其他一些操作Mol的方法,对RWMol也同样适用
    >>> print(Chem.MolToSmiles(mw))
    O=CC1=NC=CC=C1
    >>> print(Chem.SanitizeMol(mw))
    SANITIZE_NONE
    >>> print(Chem.MolToSmiles(mw))
    O=Cc1ccccn1
    
    • 修改完后,可以获取该分子的Mol对象:mw.GetMol()
    >>> m_edit = mw.GetMol()
    >>> type(m_edit)
    rdkit.Chem.rdchem.Mol
    
    • 大功告成

    本文参考自rdkit官方文档
    代码及源文件在这里

    相关文章

      网友评论

        本文标题:RDKit|分子修改与编辑

        本文链接:https://www.haomeiwen.com/subject/azkjahtx.html