计算机科学>计算机视觉和模式识别
标题: DPM-OT:一种新的基于最优运输的扩散概率模型
摘要: 从扩散概率模型(DPM)中采样可以被视为分段分布变换,这通常需要逆扩散轨迹的数百或数千步才能获得高质量的图像。 DPM快速采样器设计的最新进展是通过知识提取或调整方差调度或去噪方程,在采样速度和采样质量之间取得平衡。 然而,它不可能在两个方面都达到最优,并且经常在短时间内出现模式混合。 为了解决这个问题,我们创新性地将逆扩散视为不同阶段潜在者之间的最优运输(OT)问题,并提出了DPM-OT,这是一个用于快速DPM的统一学习框架,以OT图为代表的直接高速公路,可以在大约10个功能评估内生成高质量的样本。 通过计算数据潜伏期和白噪声之间的半离散最优运输图,我们获得了高速公路从先验分布到数据分布的过程,同时显著缓解了模式混合问题。 此外,我们给出了该方法的误差界,从理论上保证了算法的稳定性。 大量实验验证了DPM-OT在速度和质量(FID和模式混合)方面的有效性和优势,从而为生成性建模提供了一种有效的解决方案。 源代码可在 此https URL