Evaluation of QSAR Equations for Virtual Screening

doi:10.3390/ijms21217828

.2020年10月22日；21(21):7828.

doi:10.3390/ijms2127828。

虚拟筛选的QSAR方程评估

雅各布·斯皮格尔¹, Hanoch Senderowitz公司¹

附属公司

PMID： 33105703
预防性维修识别码： PMC7672587号
内政部： 10.3390/ijms2127828

虚拟筛选的QSAR方程评估

雅各布·斯皮格尔等。国际分子科学杂志. 2020.

.2020年10月22日；21(21):7828.

doi:10.3390/ijms2127828。

作者

雅各布·斯皮格尔¹, Hanoch Senderowitz公司¹

附属

¹以色列拉马特甘巴伊兰大学化学系，邮编：5290002。

PMID： 33105703
预防性维修识别码： PMC7672587号
内政部： 10.3390/ijms2127828

摘要

定量构效关系（QSAR）模型可以提供活性与基于结构的分子描述符之间的相关性信息。这些信息对于理解控制分子性质的因素以及设计具有良好性质的新化合物非常重要。由于有大量可计算的描述符，因此，描述符组合的数量要大得多，因此QSAR模型的推导可以视为一个优化问题。对于连续响应，通常在此过程中优化的指标与训练集上的模型性能有关，例如R2和QCV2。根据外部数据集（例如QF1/F2/F32）计算的类似指标用于评估最终模型的性能。这些指标的一个共同主题是它们是上下文-“无知”。在这项工作中，我们建议QSAR模型应该根据其预期用途进行评估。更具体地说，我们认为，为虚拟筛选（VS）开发的QSAR模型应该使用虚拟筛选感知度量来推导和评估，例如，基于丰富的度量。为了证明这一点，我们为七个目标（每个目标三个模型）开发了21个多元线性回归（MLR）模型，首先在验证集上对其进行评估，然后在为模拟小规模虚拟筛选活动而构建的另外两个测试集上测试其性能。正如预期的那样，我们发现通过“经典”指标（例如R2和QF1/F2/F32）评估的模型性能与模型从随机化合物池中选取的活性化合物数量之间没有相关性。特别是，在某些情况下，R2和/或QF1/F2/F32值良好的模型无法从池中挑选出单一活性化合物，而在其他情况下，在虚拟筛选的环境中，R2和（或）QF1/F3/F32值较差的模型表现良好。我们还发现，在训练、验证和测试集中，模型正确识别的活性化合物数量之间没有显著相关性。接下来，我们通过优化基于丰富度的度量，开发了一种新的MLR模型推导算法，并在相同的数据集上测试了其性能。我们发现，在大多数情况下，以这种方式导出的最佳模型在训练、验证和测试集上显示出更加一致的结果，并在大多数虚拟筛选测试中优于相应的MLR模型。最后，我们证明，当作为二进制分类器进行测试时，在大多数情况下，通过新算法为相同目标导出的模型在训练/验证/测试集上都优于基于随机森林（RF）和支持向量机（SVM）的模型。我们将VS中丰富优化算法（EOA）模型的更好性能归因于更好地处理非活性随机化合物。因此，优化基于富集度的度量是推导用于分类和虚拟筛选的QSAR模型的一种很有前途的策略。

关键词：QSAR方程；定量构效关系模型；浓缩优化器算法（EOA）；基于丰富的优化；多元线性回归（MLR）；随机森林；支持向量机；虚拟筛选（VS）。

PubMed免责声明

利益冲突声明

作者声明没有利益冲突。

数字

图1
包含7个描述符模型的描述符空间中训练集（橙色）、验证集（灰色）和测试集1（蓝色）化合物的主成分分析（PCA）图(左边)，10个描述符模型(**中间的**)和13描述符模型(**正确的**)用于M2数据集。前两个主成分分别占7描述符、10描述符和13描述符模型原始方差的49%、42%和35%。

请参阅PMC中的此图像和版权信息

类似文章

面向虚拟筛选的基于富集优化算法（EOA）的目标特定对接功能。
Spiegel J、Senderowitz H。 Spiegel J等人。摩尔通知。2022年11月；41（11）：e220034。doi:10.1002/minf.202200034。Epub 2022年7月26日。摩尔通知。2022 PMID：35790469 免费PMC文章。
基于扩展优化算法（EOA）和基于停靠的虚拟筛选的比较。
Spiegel J、Senderowitz H。 Spiegel J等人。国际分子科学杂志。2021年12月21日；23(1):43. doi:10.3390/ijms23010043。国际分子科学杂志。2021 PMID：35008467 免费PMC文章。
GA-MLR在芳基硫代吲哚类管蛋白聚合抑制剂抗癌药QSAR建模中的应用。
Ahmadi S、Habibpour E。 Ahmadi S等人。抗癌药物药物化学。2017;17(4):552-565. doi:10.2174/1871520616666160811162105。抗癌药物药物化学。2017 PMID：27528182
用于验证预测性QSAR模型的各种指标，以及在虚拟筛选和重点库设计中的应用。
罗伊·K、米特拉·I。 Roy K等人。梳状化学高通量屏幕。2011年7月；14(6):450-74. doi:10.2174/138620711795767893。梳状化学高通量屏幕。2011 PMID：21521150 审查。
基于定量构效关系（QSAR）的虚拟筛选在药物设计中的应用：综述。
Achary PGR公司。 Achary PGR公司。迷你版医学化学。2020;20（14）：1375-1388。doi:10.2174/1389557520666200429102334。迷你版医学化学。2020 PMID：32348219 审查。

查看所有类似文章

引用人

基于机器学习的化学信息学的最新进展：综合评述。
Niazi SK，Mariam Z。 Niazi SK等人。国际分子科学杂志。2023年7月15日；24（14）：11488。doi:10.3390/ijms241411488。国际分子科学杂志。2023 PMID：37511247 免费PMC文章。审查。
面向一种基于扩展优化算法（EOA）的虚拟筛选目标特定对接函数。
Spiegel J、Senderowitz H。 Spiegel J等人。摩尔通知。2022年11月；41（11）：e2200034。doi:10.1002/minf.202200034。Epub 2022年7月26日。摩尔通知。2022 PMID：35790469 免费PMC文章。
新型双环（芳基甲基）苯甲酰胺作为治疗精神分裂症的有效GlyT1抑制剂的硅药代动力学、分子对接和分子动力学研究中的QSAR、ADMET。
El Fadili M、Er-Rajy M、Kara M、Assouguem A、Belhassan A、Alotaibi A、Mrabti NN、Fidan H、Ullah R、Ercisli S、Zarougui S、Elhallaoui M。 El Fadili M等人。制药（巴塞尔）。2022年5月27日；15(6):670. doi:10.3390/ph15060670。制药（巴塞尔）。2022 PMID：35745588 免费PMC文章。
虚拟组合化学和药理学筛选：药物设计简短指南。
Suay-Garcia B、Bueso-Bordils JI、Falcóa、Antón-Fos GM、Alemán-López PA。 Suay-Garcia B等人。国际分子科学杂志。2022年1月30日；23(3):1620. doi:10.3390/ijms23031620。国际分子科学杂志。2022 PMID：35163543 免费PMC文章。审查。
基于扩展优化算法（EOA）和基于停靠的虚拟筛选的比较。
Spiegel J、Senderowitz H。 Spiegel J等人。国际分子科学杂志。2021年12月21日；23(1):43. doi:10.3390/ijms23010043。国际分子科学杂志。2021 PMID：35008467 免费PMC文章。

查看所有“被引用”文章

工具书类

1. Kim E.，Nam H.使用加权分子指纹预测药物诱导肝毒性模型。BMC生物信息。2017;18:227. doi:10.1186/s12859-017-1638-4。-内政部-项目管理咨询公司-公共医学
1. Low Y.、Uehara T.、Minowa Y.、Yamada H.、Ohno Y.、Ruushidani T.、Sedykh A.、Muratov E.、Kuz'Min V.、Fourches D.等人。使用QSAR和毒理学方法预测药物诱导的肝毒性。化学。研究毒物。2011;24:1251–1262. doi:10.1021/tx200148a。-内政部-项目管理咨询公司-公共医学
1. Öberg T.基线毒性的QSAR：验证、应用领域和预测。化学。研究毒物。2004;17:1630–1637. doi:10.1021/tx0498253。-内政部-公共医学
1. Mazzatorta P.、Smieško M.、Piparo E.L.、Benfenati E.用于预测农药水生毒性的QSAR模型。化学杂志。信息模型。2005;45:1767–1774. doi:10.1021/ci050247l。-内政部-公共医学
1. Alves V.M.、Capuzzi S.J.、Muratov E.N.、Braga R.C.、Thornton T.E.、Fourches D.、Strickland J.、Kleinstreuer N.、Andrade C.H.、Tropsha A.人类数据的QSAR模型可以丰富或取代人类皮肤敏化的LLNA测试。绿色化学。2016;18:6501–6515. doi:10.1039/C6GC01836J。-内政部-项目管理咨询公司-公共医学

MeSH术语

行动
行动
行动
行动
行动
行动
行动
行动
行动
行动
行动
行动

LinkOut-更多资源

[1] Kim E.，Nam H.使用加权分子指纹预测药物诱导肝毒性模型。BMC生物信息。2017;18:227. doi:10.1186/s12859-017-1638-4。-内政部-项目管理咨询公司-公共医学

[2] Kim E.，Nam H.使用加权分子指纹预测药物诱导肝毒性模型。BMC生物信息。2017;18:227. doi:10.1186/s12859-017-1638-4。-内政部-项目管理咨询公司-公共医学

[3] Low Y.、Uehara T.、Minowa Y.、Yamada H.、Ohno Y.、Ruushidani T.、Sedykh A.、Muratov E.、Kuz'Min V.、Fourches D.等人。使用QSAR和毒理学方法预测药物诱导的肝毒性。化学。研究毒物。2011;24:1251–1262. doi:10.1021/tx200148a。-内政部-项目管理咨询公司-公共医学

[4] Low Y.、Uehara T.、Minowa Y.、Yamada H.、Ohno Y.、Ruushidani T.、Sedykh A.、Muratov E.、Kuz'Min V.、Fourches D.等人。使用QSAR和毒理学方法预测药物诱导的肝毒性。化学。研究毒物。2011;24:1251–1262. doi:10.1021/tx200148a。-内政部-项目管理咨询公司-公共医学

[5] Öberg T.基线毒性的QSAR：验证、应用领域和预测。化学。研究毒物。2004;17:1630–1637. doi:10.1021/tx0498253。-内政部-公共医学

[6] Öberg T.基线毒性的QSAR：验证、应用领域和预测。化学。研究毒物。2004;17:1630–1637. doi:10.1021/tx0498253。-内政部-公共医学

[7] Mazzatorta P.、Smieško M.、Piparo E.L.、Benfenati E.用于预测农药水生毒性的QSAR模型。化学杂志。信息模型。2005;45:1767–1774. doi:10.1021/ci050247l。-内政部-公共医学

[8] Mazzatorta P.、Smieško M.、Piparo E.L.、Benfenati E.用于预测农药水生毒性的QSAR模型。化学杂志。信息模型。2005;45:1767–1774. doi:10.1021/ci050247l。-内政部-公共医学

[9] Alves V.M.、Capuzzi S.J.、Muratov E.N.、Braga R.C.、Thornton T.E.、Fourches D.、Strickland J.、Kleinstreuer N.、Andrade C.H.、Tropsha A.人类数据的QSAR模型可以丰富或取代人类皮肤敏化的LLNA测试。绿色化学。2016;18:6501–6515. doi:10.1039/C6GC01836J。-内政部-项目管理咨询公司-公共医学

[10] Alves V.M.、Capuzzi S.J.、Muratov E.N.、Braga R.C.、Thornton T.E.、Fourches D.、Strickland J.、Kleinstreuer N.、Andrade C.H.、Tropsha A.人类数据的QSAR模型可以丰富或取代人类皮肤敏化的LLNA测试。绿色化学。2016;18:6501–6515. doi:10.1039/C6GC01836J。-内政部-项目管理咨询公司-公共医学

将引文保存到文件

电子邮件引文

添加到集合

添加到我的书目

您保存的搜索

为外部引文管理软件创建文件

您的RSS源

虚拟筛选的QSAR方程评估

附属

虚拟筛选的QSAR方程评估

作者

附属

摘要

利益冲突声明

数字

类似文章

引用人

工具书类

MeSH术语

物质

LinkOut-更多资源

全文源

研究材料

其他

摘要

利益冲突声明

数字

类似文章

引用人

工具书类

MeSH术语

物质

相关信息

LinkOut-更多资源

全文源

研究材料

其他