跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2020年10月22日;21(21):7828.
doi:10.3390/ijms2127828。

虚拟筛选的QSAR方程评估

附属公司

虚拟筛选的QSAR方程评估

雅各布·斯皮格尔等。 国际分子科学杂志. .

摘要

定量构效关系(QSAR)模型可以提供活性与基于结构的分子描述符之间的相关性信息。这些信息对于理解控制分子性质的因素以及设计具有良好性质的新化合物非常重要。由于有大量可计算的描述符,因此,描述符组合的数量要大得多,因此QSAR模型的推导可以视为一个优化问题。对于连续响应,通常在此过程中优化的指标与训练集上的模型性能有关,例如R2和QCV2。根据外部数据集(例如QF1/F2/F32)计算的类似指标用于评估最终模型的性能。这些指标的一个共同主题是它们是上下文-“无知”。在这项工作中,我们建议QSAR模型应该根据其预期用途进行评估。更具体地说,我们认为,为虚拟筛选(VS)开发的QSAR模型应该使用虚拟筛选感知度量来推导和评估,例如,基于丰富的度量。为了证明这一点,我们为七个目标(每个目标三个模型)开发了21个多元线性回归(MLR)模型,首先在验证集上对其进行评估,然后在为模拟小规模虚拟筛选活动而构建的另外两个测试集上测试其性能。正如预期的那样,我们发现通过“经典”指标(例如R2和QF1/F2/F32)评估的模型性能与模型从随机化合物池中选取的活性化合物数量之间没有相关性。特别是,在某些情况下,R2和/或QF1/F2/F32值良好的模型无法从池中挑选出单一活性化合物,而在其他情况下,在虚拟筛选的环境中,R2和(或)QF1/F3/F32值较差的模型表现良好。我们还发现,在训练、验证和测试集中,模型正确识别的活性化合物数量之间没有显著相关性。接下来,我们通过优化基于丰富度的度量,开发了一种新的MLR模型推导算法,并在相同的数据集上测试了其性能。我们发现,在大多数情况下,以这种方式导出的最佳模型在训练、验证和测试集上显示出更加一致的结果,并在大多数虚拟筛选测试中优于相应的MLR模型。最后,我们证明,当作为二进制分类器进行测试时,在大多数情况下,通过新算法为相同目标导出的模型在训练/验证/测试集上都优于基于随机森林(RF)和支持向量机(SVM)的模型。我们将VS中丰富优化算法(EOA)模型的更好性能归因于更好地处理非活性随机化合物。因此,优化基于富集度的度量是推导用于分类和虚拟筛选的QSAR模型的一种很有前途的策略。

关键词:QSAR方程;定量构效关系模型;浓缩优化器算法(EOA);基于丰富的优化;多元线性回归(MLR);随机森林;支持向量机;虚拟筛选(VS)。

PubMed免责声明

利益冲突声明

作者声明没有利益冲突。

数字

图1
图1
包含7个描述符模型的描述符空间中训练集(橙色)、验证集(灰色)和测试集1(蓝色)化合物的主成分分析(PCA)图(左边),10个描述符模型(中间的)和13描述符模型(正确的)用于M2数据集。前两个主成分分别占7描述符、10描述符和13描述符模型原始方差的49%、42%和35%。

类似文章

引用人

工具书类

    1. Kim E.,Nam H.使用加权分子指纹预测药物诱导肝毒性模型。BMC生物信息。2017;18:227. doi:10.1186/s12859-017-1638-4。-内政部-项目管理咨询公司-公共医学
    1. Low Y.、Uehara T.、Minowa Y.、Yamada H.、Ohno Y.、Ruushidani T.、Sedykh A.、Muratov E.、Kuz'Min V.、Fourches D.等人。使用QSAR和毒理学方法预测药物诱导的肝毒性。化学。研究毒物。2011;24:1251–1262. doi:10.1021/tx200148a。-内政部-项目管理咨询公司-公共医学
    1. Öberg T.基线毒性的QSAR:验证、应用领域和预测。化学。研究毒物。2004;17:1630–1637. doi:10.1021/tx0498253。-内政部-公共医学
    1. Mazzatorta P.、Smieško M.、Piparo E.L.、Benfenati E.用于预测农药水生毒性的QSAR模型。化学杂志。信息模型。2005;45:1767–1774. doi:10.1021/ci050247l。-内政部-公共医学
    1. Alves V.M.、Capuzzi S.J.、Muratov E.N.、Braga R.C.、Thornton T.E.、Fourches D.、Strickland J.、Kleinstreuer N.、Andrade C.H.、Tropsha A.人类数据的QSAR模型可以丰富或取代人类皮肤敏化的LLNA测试。绿色化学。2016;18:6501–6515. doi:10.1039/C6GC01836J。-内政部-项目管理咨询公司-公共医学