本研究收集了232个引起肌肉病变毒性、117个不引起肌肉病变毒性、186个引起横纹肌溶解毒性以及117个不引起横纹肌溶解毒性的化合物,利用自组织神经网络和支持向量机方法,基于化合物的物理化学性质描述符,分别对肌肉病变毒性和横纹肌溶解毒性进行了预测,预测正确率均大于80%。发现原子电荷、电负性、极性等相关描述符与化合物的肌也许肉病变毒性和横纹肌溶解毒性有一定的关系;另外还分析了化合物子结构与肌肉病变毒性和横纹肌溶解毒性的关系,发现一些子结构能够更频繁或者只出现在引起肌肉病变毒性或横纹肌溶解毒性的化合物中。 (四)对化合物生物活性极化的系统性分析和预测研究: 化合物活性极化是指化合物的结构相似但其活性差异很大(通常定义以及活性差异,如Ki值差异,大于2个数量级),即结构上的微小改变对其活性有很大影响。目前,在化合物活性极化研究中,化合物结构相似性一般以分子指纹图谱的Tanimoto相似性值表征。 在本研究中,首先采用子结构关系评估化合物的结构相似性,利用只有一个子结构不同的化合物对(即匹配分子对)来替代计算化合物一般的具体相似性数值,进行了化合物活性极化的系统性分析(只考虑Ki值小于10μM的化合物)。从BindingDB数据库中收集了包含至少5个化合物的621个不同生物活性数据集,基于匹配分子对,系统地分析了每个数据集中的化合物活性极化以及其频率。研究发现,在活性极化化合物对中,大小分别为5-8个和1-3个重原子的子结构相互转换经常发生,而且大部分数据集中化合物活性极化频率均比较低。