收益

增益:使用生成对抗网进行缺失数据插补。我们提出了一种新的基于生成性对抗网(Generative attersarial Nets,GAN)框架的缺失数据填补方法。因此,我们将我们的方法称为生成性对抗性插补网(GAIN)。生成器(G)观察真实数据向量的某些分量,根据实际观察到的内容对缺失的分量进行插补,并输出一个完整的矢量。鉴别器(D)然后获取一个完整的向量,并尝试确定哪些分量被实际观察到,哪些分量被插补。为了确保D迫使G学习期望的分布,我们以提示向量的形式向D提供一些附加信息。提示向D透露了关于原始样本缺失的部分信息,D利用这些信息集中注意特定成分的插补质量。这个提示确保了G确实学会了根据真实的数据分布生成。我们在各种数据集上测试了我们的方法,发现GAIN显著优于最先进的插补方法。