本文主要介绍如何利用RDKit解决化合物SMILES表示中出现的原子价态错误,报错Explicit valence for atom # 1 C, 5, is greater than permitted。
问题现象:
mol = Chem.MolFromSmiles("C[CH2+]1(C#N)CC1") #运行后报错如下
>>> [11:09:12] Explicit valence for atom # 1 C, 5, is greater than permitted
问题原因
出现以上问题主要是原子的价键有问题,第一个C原子有5个键,所以出现上面这个报错。只要重新设置一下第一个原子的键价即可。
解决办法:
# 首先需要设置sanitize = False,读取不合理的分子
mol = Chem.MolFromSmiles("C[CH2+]1(C#N)CC1", sanitize=False)
# 先更新Proterty,这样后面才能计算显示氢
mol.UpdatePropertyCache(strict=False)
# 通过GetAtomWithIdx获得报错的那个原子,然后计算他的形式电荷FormalCharge,和化合键数量
# 从上面的那个报错来看,是第1个C原子有问题,因此拿到第一个原子的Atom
mol.GetAtomWithIdx(1).GetFormalCharge() # 电荷是1
>>> 1
mol.GetAtomWithIdx(1).GetExplicitValence() # 化合键是 6
>>> 6
# 化合键是6,形式电荷只有1,所以上面会报错C是5键,正常情况下C只有4个化合键,因此需要重新设置显示氢的个数1。
mol.GetAtomWithIdx(1).SetNumExplicitHs(1)
# 设置完成之后,输出更新好键价的Smiles
print(Chem.MolToSmiles(mol))
输出:
C[CH+]1(C#N)CC1
验证:输出是否已经正确
mol_new = Chem.MolFromSmiles('C[CH+]1(C#N)CC1')
print(Chem.AddHs(mol_new)) # 输出如下
<rdkit.Chem.rdchem.Mol object at 0x0000027073390AC0>
至此已经解决,欢迎大家提出问题,我们随时交流。