TenGAN:纯变压器编码器为De Novo分子生成提供高效的离散GAN

陈丽、山下义弘
第27届国际人工智能与统计会议记录,PMLR 238:361-3692024年。

摘要

利用离散数据进行从头生成分子的深度生成模型,例如简化的分子输入线性系统(SMILES)字符串,在药物设计中引起了广泛关注。然而,训练不稳定性经常困扰生成性对抗网络(GAN),导致模式崩溃和低多样性等问题。本研究提出一种基于纯变压器编码器的GAN(TenGAN)来解决这些问题。TenGAN的生成器和鉴别器是变压器编码器的变体,并与强化学习(RL)相结合,以生成具有所需化学特性的分子。此外,变体SMILES的数据增强用于TenGAN培训,以学习SMILES字符串的语义和语法。此外,我们引入了一种增强型TenGAN变体,名为Ten(W)GAN,它结合了微背辨别和Wasserstein GAN,以提高生成分子的能力。QM9和ZINC数据集的实验结果和烧蚀研究表明,所提出的模型以高效的计算方式生成了具有所需化学性质的高效新型分子。

引用本文


BibTeX公司
@会议记录{pmlr-v238-li24d,title={{TenGAN}:Pure Transformer Encoders Make a Efficient Discrete{GAN}for De Novo Molecular Generation}纯变压器编码器为新分子生成制造高效的离散{GANneneneep,author={李,陈,山西,吉弘},booktitle={第27届国际人工智能与统计会议论文集},页数={361--369},年份={2024},editor={Dasgupta、Sanjoy和Mandt、Stephan和Li、Yingzhen},体积={238},series={机器学习研究论文集},月={02年5月4日},publisher={PMLR},pdf={https://proceedings.mlr.press/v238/li24d/li24d.pdf},url={https://proceedings.mlr.press/v238/li24d.html},abstract={利用离散数据进行从头生成分子的深度生成模型,例如简化的分子输入线工程系统(SMILES)字符串,在药物设计中引起了广泛关注。然而,训练不稳定性常常困扰生成对抗网络(GAN)导致模式崩溃和低分集等问题。本研究提出一种基于纯变压器编码器的GAN(TenGAN)来解决这些问题。TenGAN的生成器和鉴别器是变压器编码器的变体,并与强化学习(RL)相结合,以生成具有所需化学性质的分子。此外,变体SMILES的数据增强用于TenGAN培训,以学习SMILES字符串的语义和语法。此外,我们引入了TenGAN的增强变体,名为Ten(W)GAN,它结合了小批量辨别和Wasserstein GAN,以提高产生分子的能力。QM9和ZINC数据集的实验结果和烧蚀研究表明,所提出的模型以高效的计算方式生成了具有所需化学性质的高效新型分子。}}
尾注
%0会议论文%T TenGAN:纯变压器编码器为De Novo分子生成提供高效的离散GAN%李晨%山下义弘%第27届国际人工智能与统计会议论文集%C机器学习研究进展%D 2024年%E桑乔伊·达斯古普塔%E斯蒂芬·曼特%李英珍%F pmlr-v238-li24d型%我PMLR%第361--369页%U型https://proceedings.mlr.press/v238/li24d.html%伏238%X使用离散数据进行从头生成分子的深度生成模型,例如简化的分子输入线性系统(SMILES)字符串,在药物设计中引起了广泛关注。然而,训练不稳定性经常困扰生成性对抗网络(GAN),导致模式崩溃和低多样性等问题。本研究提出一种基于纯变压器编码器的GAN(TenGAN)来解决这些问题。TenGAN的生成器和鉴别器是变压器编码器的变体,并与强化学习(RL)相结合,以生成具有所需化学特性的分子。此外,变体SMILES的数据增强用于TenGAN培训,以学习SMILES字符串的语义和语法。此外,我们引入了一种增强型TenGAN变体,名为Ten(W)GAN,它结合了微背辨别和Wasserstein GAN,以提高生成分子的能力。QM9和ZINC数据集的实验结果和烧蚀研究表明,所提出的模型以高效的计算方式生成了具有所需化学性质的高效新型分子。
亚太地区
Li,C.和Yamanishi,Y.(2024年)。TenGAN:纯变压器编码器为新分子生成提供了高效的离散GAN。第27届国际人工智能与统计会议记录,英寸机器学习研究进展238:361-369网址:https://proceedings.mlr.press/v238/li24d.html。

相关材料