投影稳健最优传输:样本复杂度和模型错误规范
林天一、郑泽瑜、陈爱玲、马可·库图里、迈克尔·乔丹
第24届国际人工智能与统计会议记录,PMLR 130:262-2702021年。
摘要
最佳运输距离(OT)越来越多地用作统计推断的损失函数,尤其是在生成模型或监督学习的学习中。然而,人们对最小Wasserstein估计量的行为知之甚少,尤其是在高维状态或模型错误指定的情况下。在这项工作中,我们采用投影稳健(PR)OT的观点,通过选择一个$k$维的子空间来将两个度量之间的OT成本最大化。我们的第一个贡献是建立了PR Wasserstein距离的几个基本统计特性,补充和改进了以往仅限于一维和特定情况的文献。接下来,我们提出积分PR-Wasserstein(IPRW)距离作为PRW距离的替代方案,通过对子空间进行平均而不是优化。我们的复杂性边界可以帮助解释为什么在高维推理任务中,PRW和IPRW距离在经验上都优于Wasserstein距离。最后,我们考虑使用PRW距离进行参数推断。我们提供了两类最小PRW估计的渐近保证,并在模型错误指定的情况下,给出了最大分段Wasserstein估计的中心极限定理。为了能够对投影维数大于1的PRW进行分析,我们设计了一种变分分析和统计理论的新组合。
引用本文
相关材料