MIWAE:不完全数据集的深度生成建模和插补

Jes Frellsen的Pierre-Alexandre Mattei
第36届机器学习国际会议论文集,2019年8月27日下午97:4413-4423。

摘要

我们考虑使用深度潜在变量模型(DLVM)处理缺失数据的问题。首先,我们提出了一种在训练集包含丢失的随机数据时训练DLVM的简单方法。我们的方法,称为MIWAE,基于重要性加权自动编码器(IWAE),最大化了观测数据对数似然的潜在紧下限。与原始IWAE相比,我们的算法不会因丢失数据而导致任何额外的计算开销。我们还使用在不完整数据集上训练的DLVM开发了用于单插补和多插补的蒙特卡罗技术。我们通过在MNIST的不完全静态二值化上训练卷积DLVM来说明我们的方法。此外,在各种连续数据集上,我们表明MIWAE提供了极其准确的单次插补,并且与最先进的方法具有高度竞争力。

引用本文


BibTeX公司
@会议记录{pmlr-v97-mattei19a,title={{MIWAE}:不完整数据集的深度生成建模和插补},author={Mattei,Pierre-Alexandre和Frellsen,Jes},booktitle={第36届国际机器学习大会论文集},页码={4413--4423},年份={2019},editor={乔杜里、卡马利卡和萨拉库丁诺夫、鲁斯兰},体积={97},series={机器学习研究论文集},月={09--6月15日},发布者={PMLR},pdf={http://proceedings.mlr.press/v97/mattei19a/mattei19a.pdf},url={https://proceedings.mlr.press/v97/mattei19a.html},abstract={我们考虑用深度潜在变量模型(DLVM)处理缺失数据的问题。首先,当训练集包含缺失的随机数据时,我们提出了一种简单的训练DLVM的技术。我们的方法,称为MIWAE,是基于重要性加权自动编码器(IWAE),并最大化观测数据的对数似然的潜在紧下限。与原始IWAE相比,我们的算法不会因丢失数据而导致任何额外的计算开销。我们还使用在不完整数据集上训练的DLVM开发了用于单插补和多插补的蒙特卡罗技术。我们通过在MNIST的不完全静态二值化上训练卷积DLVM来说明我们的方法。此外,在各种连续数据集上,我们表明MIWAE提供了极其准确的单次插补,并且与最先进的方法具有高度竞争力。}}
尾注
%0会议论文%T MIWAE:不完全数据集的深度生成建模和插补%A Pierre-Alexandre马泰%杰斯·弗莱尔森%第36届机器学习国际会议论文集%C机器学习研究进展%2019年4月%E卡马利卡·乔杜里%E Ruslan Salakhutdinov公司%F pmlr-v97-mattei19a公司%我PMLR%电话4413-4423%U型https://proceedings.mlr.press/v97/mattei19a.html%第97版%我们考虑用深度潜在变量模型(DLVM)处理缺失数据的问题。首先,我们提出了一种在训练集包含丢失的随机数据时训练DLVM的简单方法。我们的方法,称为MIWAE,基于重要性加权自动编码器(IWAE),最大化了观测数据对数似然的潜在紧下限。与原始的IWAE相比,我们的算法没有由于数据丢失而导致任何额外的计算开销。我们还使用在不完整数据集上训练的DLVM开发了用于单插补和多插补的蒙特卡罗技术。我们通过在MNIST的不完全静态二值化上训练卷积DLVM来说明我们的方法。此外,在各种连续数据集上,我们表明MIWAE提供了极其准确的单次插补,并且与最先进的方法具有高度竞争力。
亚太地区
Mattei,P.&Frellsen,J.(2019年)。MIWAE:不完整数据集的深度生成建模和插补。第36届机器学习国际会议论文集,英寸机器学习研究进展97:4413-4423网址:https://proceedings.mlr.press/v97/mattei19a.html。

相关材料