TenGAN:纯变压器编码器为De Novo分子生成提供高效的离散GAN
陈丽、山下义弘
第27届国际人工智能与统计会议记录,PMLR 238:361-3692024年。
摘要
利用离散数据进行从头生成分子的深度生成模型,例如简化的分子输入线性系统(SMILES)字符串,在药物设计中引起了广泛关注。然而,训练不稳定性经常困扰生成性对抗网络(GAN),导致模式崩溃和低多样性等问题。本研究提出一种基于纯变压器编码器的GAN(TenGAN)来解决这些问题。TenGAN的生成器和鉴别器是变压器编码器的变体,并与强化学习(RL)相结合,以生成具有所需化学特性的分子。此外,变体SMILES的数据增强用于TenGAN培训,以学习SMILES字符串的语义和语法。此外,我们引入了一种增强型TenGAN变体,名为Ten(W)GAN,它结合了微背辨别和Wasserstein GAN,以提高生成分子的能力。QM9和ZINC数据集的实验结果和烧蚀研究表明,所提出的模型以高效的计算方式生成了具有所需化学性质的高效新型分子。
引用本文
相关材料