并行多尺度自回归密度估计
斯科特·里德(Scott Reed)、阿伦·奥尔德(Aäron Oord)、纳尔·卡尔克布伦纳(Nal Kalchbrenner)、塞尔吉奥·戈梅斯·科尔梅纳雷霍(Sergio Gómez Colmenarejo)、王子玉(Ziyu Wang)、陈玉田(Yutian Chen)、丹·贝
第34届国际机器学习会议记录,PMLR 70:2912-29212017年。
摘要
PixelCNN在自然图像密度估计方面取得了最先进的结果。虽然训练速度很快,但推理成本很高,需要每个像素进行一次网络评估;O(N)表示N个像素。这可以通过缓存激活来加快速度,但仍然需要按顺序生成每个像素。在这项工作中,我们提出了一种并行化的PixelCNN,通过将某些像素组建模为条件独立的,从而实现更高效的推理。我们的新PixelCNN模型实现了具有竞争力的密度估计和数量级加速-O(对数N)采样而不是O(N)采样-实现了512x512图像的实际生成。我们在类条件图像生成、文本到图像合成和动作条件视频生成方面对该模型进行了评估,结果表明,在允许有效采样的非像素自回归密度模型中,我们的模型取得了最佳结果。
引用本文
相关材料