用于解纠缠表示学习的可解释分子生成数据集

引文作者:
元气
乔治·梅森大学
小杰
乔治·梅森大学
阿玛达
谢胡
乔治·梅森大学
埃默里大学
提交人:
杜元奇
上次更新时间:
2021年4月18日星期日-09:18
内政部:
10.2127/vteb-j724
数据格式:
许可证:
341视图
类别:
关键词:
0
0分-请登录提交您的评分。

摘要

扩大我们对小分子的认识,使其超越自然界已知的或在湿实验室中设计的小分子,有望大大促进药物发现、生物技术和材料科学。计算具有特定结构和功能特性的新型小分子是非常重要的,主要是由于相应搜索空间的大小、维数和多模态。无需领域洞察力直接从数据中学习的深层生成模型最近提供了一种前进的方式。特别是,能够通过基于图形的小分子表示来捕获详细原子相互作用的图形生成框架显示出了有希望的结果。然而,这些框架仍然不透明,不允许深入了解其生成过程。在本文中,我们利用图变分自动编码器框架中的解纠缠概念,为解决这一局限性迈出了第一步{蓝色}我们在这个框架内提出了各种解缠结学习技术,产生了新的解缠结深度图生成模型,我们将其与用于小分子生成的图生成deeep学习的最新技术进行了比较。我们证明,这些模型有效地实现了可变尺寸图的推理和生成的学习目标。}广泛的定性和定量实验评估证明了我们的解缠结框架在小分子生成方面的优势,以及各种关键措施,如准确性、新颖性和解缠结学习。

说明:

QM9和ZINC数据集的序列和验证文件均以json格式提供并存储,其中包含atoms、bonds和smiles字符串格式。QM9和ZINC数据集生成的最佳数据以微笑字符串格式提供。