×

平滑最优运输图的极小极大估计。 (英语) 兹比尔1468.62268

小结:布伦耶定理[Y.Brenier先生、Commun。纯应用程序。数学。44,第4期,375–417页(1991年;Zbl 0738.46011号)]是最优运输的基石,它保证在一定的正则性条件下,({mathbb{R}^d})上的两个概率分布(P\)和(Q\)之间存在最优运输映射(T\)。这项工作的主要目标是根据从(P)和(Q)中采样的数据,在额外的(T)光滑性假设下,建立这种运输图的最小最大估计率。为了实现这一目标,我们开发了一种基于半对偶最优运输问题经验版本最小化的估计器,限制为截断小波展开。利用半对偶和互补极大极小下界的新稳定性参数,证明了该估计可以实现近似极大极小最优性。此外,我们还对合成数据进行了数值实验,以支持我们的理论发现,并强调了平滑正则化的实际好处。这些是一般维交通图的第一个极大极小估计率。

MSC公司:

62G05型 非参数估计
46E30型 可测函数空间(L^p-空间、Orlicz空间、Köthe函数空间、Lorentz空间、重排不变空间、理想空间等)
42立方厘米 涉及小波和其他特殊系统的非三角调和分析
90B06型 运输、物流和供应链管理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ahidar-Coutrix,A.、Le Gouic,T.和Paris,Q.(2020年)。度量空间中经验重心的收敛速度:曲率、凸性和可展测地线。普罗巴伯。理论相关领域177 323-368. ·Zbl 1442.51004号 ·doi:10.1007/s00440-019-00950-0
[2] Alaux,J.、Grave,E.、Cuturi,M.和Joulin,A.(2018年)。多语言单词嵌入的无监督超对齐。预印本。可从arXiv:1811.01124获得。
[3] Altschuler,J.、Bach,F.、Rudi,A.和Niles-Weed,J.(2019年)。通过Nyström方法大规模扩展陷坑距离。神经信息处理系统研究进展4429-4439.
[4] Altschuler,J.、Weed,J.和Rigollet,P.(2017)。通过Sinkhorn迭代实现最优传输的近似线性时间近似算法。神经信息处理系统研究进展1964-1974.
[5] Alvarez-Melis,D.、Jaakkola,T.S.和Jegelka,S.(2018年)。结构化优化运输。国际人工智能与统计会议\(2018年4月9日至11日),西班牙加那利群岛兰萨罗特普拉亚布兰卡1771-1780.
[6] Anderes,E.、Borgwardt,S.和Miller,J.(2016)。离散Wasserstein重心:离散数据的最佳传输。数学。方法操作。物件。84 389-409. ·Zbl 1353.90074号 ·doi:10.1007/s00186-016-0549-x
[7] Arjovsky,M.、Chintala,S.和Bottou,L.(2017)。Wasserstein生成性对抗网络。机器学习国际会议214-223.
[8] Bigot,J.、Cazelles,E.和Papadakis,N.(2019年)。有限空间上熵正则最优输运的中心极限定理和统计应用。电子。J.统计。13 5120-5150. ·Zbl 1454.62136号 ·doi:10.1214/19-EJS1637
[9] Bigot,J.、Gouet,R.、Klein,T.和López,A.(2017)。通过凸PCA在Wasserstein空间中进行测地PCA。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。斯达。53 1-26. ·Zbl 1362.62065号 ·doi:10.1214/15-AIHP706
[10] Blondel,M.、Seguy,V.和Rolet,A.(2018年)。平滑且稀疏的最佳传输。国际人工智能与统计会议880-889.
[11] Brenier,Y.(1991)。向量值函数的极分解和单调重排。普通纯应用程序。数学。44 375-417. ·Zbl 0738.46011号 ·doi:10.1002/cpa.3160440402
[12] Caffarelli,L.A.(1992年)。凸势映射的正则性。J.Amer。数学。Soc公司。5 99-104. ·Zbl 0753.35031号 ·doi:10.2307/2152752
[13] 卡法雷利,洛杉矶(1992年)。凸势映射的边界正则性。普通纯应用程序。数学。45 1141-1151. ·兹比尔0778.35015 ·doi:10.1002/cpa.3160450905
[14] Caffarelli,L.A.(1996年)。凸势映射的边界正则性。二、。数学年鉴. (2) 144 453-496. ·Zbl 0916.35016号 ·doi:10.2307/2118564
[15] Caillerie,C.、Chazal,F.、Dedecker,J.和Michel,B.(2011年)。Wasserstein度量和几何推断的反褶积。电子。J.统计。5 1394-1423. ·Zbl 1274.62363号 ·doi:10.1214/11-EJS646
[16] Canas,G.和Rosasco,L.(2012年)。学习有关最佳运输指标的概率度量。神经信息处理系统研究进展2492-2500.
[17] Cazelles,E.、Seguy,V.、Bigot,J.、Cuturi,M.和Papadakis,N.(2018年)。Wasserstein空间直方图的测地PCA与log-PCA。SIAM J.科学。计算。40 B429-B456·Zbl 1387.62077号 ·doi:10.1137/17M1143459
[18] Claici,S.和Solomon,J.(2018年)。Lipschitz成本的Wasserstein核心集。预印。arXiv:1805.07412v1提供。
[19] Courty,N.、Flamary,R.、Habrard,A.和Rakotomamonjy,A.(2017年)。用于域适应的联合分布最优传输。神经信息处理系统研究进展3730-3739.
[20] Courty,N.、Flamary,R.和Tuia,D.(2014年)。具有正则化最优传输的域自适应。欧洲机器学习和数据库知识发现联合会议274-289. 柏林施普林格。
[21] Courty,N.、Flamary,R.、Tuia,D.和Rakotomamonjy,A.(2017年)。域自适应的最佳传输。IEEE传输。模式分析。机器。智力。39 1853-1865.
[22] Cuturi,M.(2013)。凹坑距离:最佳运输的光速计算。神经信息处理系统研究进展2292-2300.
[23] Dalalyan,A.和ReiSS,M.(2007年)。遍历扩散的渐近统计等价性:多维情况。普罗巴伯。理论相关领域137 25-47之间·Zbl 1105.62004号 ·doi:10.1007/s00440-006-0502-7
[24] Damodaran,B.B.、Kellenberger,B.、Flamary,R.、Tuia,D.和Courty,N.(2018)。DeepJDOT:用于无监督域适应的深度联合分布优化传输\(计算机视觉-ECCV 2018-15)第十届欧洲会议,德国慕尼黑,9月\(8-14, 2018\),程序,第四部分467-483.
[25] Dedecker,J.、Fischer,A.和Michel,B.(2015)。在一维普通平滑误差下,Wasserstein反褶积的速度有所提高。电子。J.统计。9 234-265. ·Zbl 1307.62092号 ·doi:10.1214/15-EJS997
[26] Dedecker,J.和Michel,B.(2013)。任意维超光滑误差下Wasserstein反褶积的极小极大收敛速度。《多元分析杂志》。122 278-291. ·Zbl 1280.62043号 ·doi:10.1016/j.jmva.2013.08.009
[27] Del Barrio,E.、Gamboa,F.、Gordaliza,P.和Loubes,J.-M.(2019年)。利用最优运输理论获得公平性。机器学习国际会议2357-2365.
[28] del Barrio,E.、Gordaliza,P.、Lesconel,H.和Loubes,J.-M.(2019年)。Wasserstein变分的中心极限定理和bootstrap过程及其在分布间结构关系中的应用。《多元分析杂志》。169 341-362. ·Zbl 1476.62089号 ·doi:10.1016/j.jmva.2018.09.014
[29] Dvurechensky,P.、Gasnikov,A.和Kroshnin,A.(2018年)。计算最优传输:加速梯度下降的复杂性优于Sinkhorn算法。会议记录35第十届国际机器学习会议(J.Dy和A.Krause编辑)。机器学习研究进展80 1367-1376. PMLR,Stockholmsmässan。
[30] Esposito,L.、Nitsch,C.和Trombetti,C.(2013)。凸域Poincaré不等式中的最佳常数。J.凸分析。20 253-264. ·Zbl 1263.35010号
[31] Feydy,J.、Charlier,B.、Vialard,F.和Peyré,G.(2017)。差分配准的最佳传输。医学图像计算与计算机辅助干预-MICCAI\(2017-20\)第十届国际会议,魁北克市,魁北奇,加拿大\(11-13, 2017\),诉讼程序,第一部分291-299.
[32] Flamary,R.、Cuturi,M.、Courty,N.和Rakotomamonjy,A.(2018年)。Wasserstein判别分析。机器。学习。107 1923-1945. ·Zbl 1480.62125号 ·doi:10.1007/s10994-018-5717-1
[33] Flamary,R.、Lounici,K.和Ferrari,A.(2019年)。线性Monge映射估计和最优传输域自适应的浓度界。预印本。可从arXiv:1905.10155获得。
[34] Forrow,A.、Hütter,J.-C.、Nitzan,M.、Schiebinger,G.、Rigollet,P.和Weed,J.(2019年)。通过系数化耦合实现统计最优运输。这个22第二届国际人工智能与统计会议2454-2465.
[35] Genevay,A.、Cuturi,M.、Peyré,G.和Bach,F.(2016)。大规模最优运输的随机优化。神经信息处理系统研究进展3440-3448.
[36] Genevay,A.、Peyré,G.和Cuturi,M.(2018年)。学习具有Sinkhorn分歧的生成模型。国际人工智能与统计会议\(2018年4月9日至11日),西班牙加那利群岛兰萨罗特帕亚·布兰卡1608-1617.
[37] Gigli,N.(2011年)。关于沿曲线测量的最优运输图的Hölder连续性。程序。爱丁堡。数学。Soc公司. (2) 54 401-409. ·Zbl 1232.49053号 ·doi:10.1017/S001309150800117X
[38] Giné,E.和Nickl,R.(2016)。无限维统计模型的数学基础.剑桥统计与概率数学系列40.剑桥大学出版社,纽约·Zbl 1358.62014号 ·doi:10.1017/CBO9781107337862
[39] Grave,E.、Joulin,A.和Berthet,Q.(2019年)。嵌入物与Wasserstein procustes的无监督对齐。机器学习研究进展(K.Chaudhuri和M.Sugiyama编辑)。机器学习研究进展89 1880-1890. PMLR公司。
[40] Gunsilius,F.F.(2021)。关于Brenier映射势的收敛速度。计量经济学理论1-37. ·Zbl 1493.62604号 ·doi:10.1017/S0266466621000037
[41] Härdle,W.、Kerkyacharian,G.、Picard,D.和Tsybakov,A.(1998年)。小波、近似和统计应用.统计学课堂讲稿129.纽约斯普林格·Zbl 0899.62002号 ·doi:10.1007/978-1-4612-222-4
[42] Hütter,J.-C.(2019年)。结构化数据的最小极大估计:形状约束、因果模型和最优运输。麻省理工学院博士论文。
[43] Hütter,J.-C.和Rigollet,P.(2021)。补充“平滑最优运输图的Minimax估计”https://doi.org/10.1214/20-AOS1997SUPP网站
[44] Ibragimov,I.A.和Has'minskiĭ,R.Z.(1981)。统计估计:渐近理论.数学应用16.纽约州斯普林格。塞缪尔·科茨(Samuel Kotz)译自俄语。
[45] Janati,H.、Cuturi,M.和Gramfort,A.(2019年)。稀疏多任务回归的Wasserstein正则化。这个22第二届国际人工智能与统计会议1407-1416.
[46] Jones,P.W.(1981)。拟共形映射与Sobolev空间中函数的可扩性。数学学报。147 71-88. ·Zbl 0489.30017号 ·doi:10.1007/BF02392869
[47] Kantorovich,L.V.(1948年)。关于蒙日的一个问题。C.R公司. (多克.)阿卡德。科学。城市道路安全系统3 225-226.
[48] Kantorovitch,L.(1942年)。关于物质的转移。C.R公司. (多克.)阿卡德。科学。城市道路安全系统37 199-201年·Zbl 0061.09705号
[49] Klatt,M.、Tameling,C.和Munk,A.(2020年)。经验正则化最优运输:统计理论和应用。SIAM J.数学。数据科学。2 419-443. ·Zbl 1483.62055号 ·doi:10.137/19M1278788
[50] Knott,M.和Smith,C.S.(1984年)。关于分布的最优映射。J.优化。理论应用。43 39-49. ·Zbl 0519.60010号 ·doi:10.1007/BF00934745
[51] Koltchinskii,V.(2011)。经验风险最小化和稀疏恢复问题中的Oracle不等式.数学课堂笔记。2033.海德堡斯普林格·Zbl 1223.91002号 ·doi:10.1007/978-3642-22147-7
[52] Kroshin,A.、Spokoiny,V.和Suvorikova,A.(2019年)。Bures-Wasserstein重心的统计推断。预印本。可从arXiv:1901.00226获得。
[53] Lavenant,H.、Claici,S.、Chien,E.和Solomon,J.(2018)。离散曲面上的动态最优传输。ACM事务处理。图表。37 250:1-250:16.
[54] Ledoux,M.(2019年)。关于高斯样本的最佳匹配。数学杂志。科学。238 495-522. ·Zbl 1478.60080号
[55] Lepskii,O.V.(1991)。高斯白噪声中的一个自适应估计问题。理论问题。申请。35 454-466. ·Zbl 0745.62083号
[56] Lepskii,O.V.(1992)。渐近极小极大自适应估计。一: 上限。最佳自适应估计。理论问题。申请。36 682-697. ·Zbl 0776.62039号
[57] Lepskii,O.V.(1993)。渐近极小极大自适应估计。二、。无最佳自适应的方案:自适应估计。理论问题。申请。37 433-448·Zbl 0787.62087号
[58] Lucet,Y.(1997)。比快速勒让德变换、线性时间勒让德变换更快。数字。算法16 171-185. ·Zbl 0909.65037号 ·doi:10.1023/A:1019191114493
[59] Mallat,S.(1999)。信号处理的小波巡视爱思唯尔,阿姆斯特丹·Zbl 0998.94510号
[60] Masarotto,V.、Panaretos,V.M.和Zemel,Y.(2019年)。对协方差算子的度量和高斯过程的最优传输进行了研究。Sankhya A公司81 172-213. ·Zbl 1420.60048号 ·doi:10.1007/s13171-018-0130-1
[61] 马萨特,P.(2007)。集中不等式与模型选择:圣佛概率学院(Ecole D'Etéde Probabilités de Saint-Flour)三十三-2003圣弗洛尔概率柏林施普林格·Zbl 1170.60006号
[62] Monge,G.(1781)。梅莫尔·苏尔·拉塞奥里·德布拉伊斯和雷姆布莱斯(Mémoire Sur La Théorie Des Déblais et Des Remblais)《巴黎皇家科学史》。
[63] Montavon,G.、Müller,K.和Cuturi,M.(2016)。Wasserstein对受限Boltzmann机器的培训。神经信息处理系统研究进展29:神经信息处理系统年会\(2016年12月5日至10日),西班牙巴塞罗那3711-3719.
[64] Müller,H.-G.和Gasser,T.(1979年)。密度函数导数核估计的最优收敛性。曲线估计的平滑技术(程序。研讨会,海德堡, 1979).数学课堂笔记。757 144-154. 柏林施普林格·Zbl 0416.62033号
[65] Munk,A.和Czado,C.(1998年)。相似分布的非参数验证和拟合优度评估。J.R.统计社会服务。B.统计方法。60 223-241. ·Zbl 0909.62047号 ·doi:10.111/1467-9868.00121
[66] Murphy,K.P.(2012)。机器学习:概率观点麻省理工学院出版社,剑桥·Zbl 1295.68003号
[67] Niles Weed,J.和Rigollet,P.(2019)。尖峰传输模型中Wasserstein距离的估计。预印本。可从arXiv:1909.07513获得·Zbl 1437.62227号
[68] Panaretos,V.M.和Zemel,Y.(2019)。Wasserstein距离的统计方面。每年。Rev.Stat.应用。6 405-431. ·doi:10.1146/annurev-statistics-030718-104938
[69] Perrot,M.、Courty,N.、Flamary,R.和Habrard,A.(2016)。离散最优运输的映射估计。神经信息处理系统研究进展4197-4205.
[70] Peyré,G.和Cuturi,M.(2019)。计算最优运输。已找到。趋势马赫数。学习。11 355-607.
[71] Ramdas,A.、Trillos,N.G.和Cuturi,M.(2017年)。关于Wasserstein双样本检验和相关非参数检验家族。19第47号论文·doi:10.3390/e19020047
[72] Rigollet,P.和Weed,J.(2018年)。熵最优输运是最大似然反褶积。C.R.数学。阿卡德。科学。巴黎356 1228-1235. ·Zbl 1407.62211号 ·doi:10.1016/j.crma.2018.10.10
[73] Rigollet,P.和Weed,J.(2019年)。通过最小Wasserstein反褶积实现非耦合等渗回归。Inf.推断8 691-717. ·Zbl 1471.62335号 ·doi:10.1093/imaiai/iaz006
[74] Rolet,A.、Cuturi,M.和Peyré,G.(2016)。快速的字典学习和平滑的Wasserstein损失。会议记录19第十届国际人工智能与统计会议2016年,西班牙加的斯,五月\(9-11, 2016 630-638\).
[75] Rüschendorf,L.和Rachev,S.T.(1990)。具有最小距离的随机变量的特征。《多元分析杂志》。32 48-54. ·Zbl 0688.62034号 ·doi:10.1016/0047-259X(90)90070-X
[76] Santambrogio,F.(2015)。应用数学家的最佳传输:变分法、偏微分方程和建模.非线性微分方程及其应用研究进展87.比克哈泽/施普林格,查姆·Zbl 1401.49002号 ·doi:10.1007/978-3-319-20828-2
[77] Schiebinger,G.、Shu,J.、Tabaka,M.、Cleary,B.、Subramanian,V.、Solomon,A.、Gould,J.,Liu,S.、Lin,S.等人(2019年)。单细胞基因表达的最佳转运分析确定了重编程中的发育轨迹。单元格176 928-943.e22·doi:10.1016/j.cell.2019.01.006
[78] Schmitz,M.A.、Heitz,M.、Bonneel,N.、Mboula,F.M.N.、Coeurjolly,D.、Cuturi,M.,Peyre,G.和Starck,J.(2018)。Wasserstein字典学习:基于最优传输的无监督非线性字典学习。SIAM J.成像科学。11 643-678. ·Zbl 1437.94027号
[79] Schmitz,M.A.、Heitz,M.、Bonneel,N.、Ngolè,F.、Coeurjolly,D.、Cuturi,M.,Peyre,G.和Starck,J.-L.(2018年)。Wasserstein字典学习:基于最优传输的无监督非线性字典学习。SIAM J.成像科学。11 643-678. ·Zbl 1437.94027号 ·doi:10.1137/17M1140431
[80] Seguy,V.和Cuturi,M.(2015)。最优运输度量下概率测度的主测地线分析。神经信息处理系统研究进展28:神经信息处理系统年会\(2015年12月7日至12日),加拿大魁北克省蒙特利尔3312-3320.
[81] Seguy,V.、Damodaran,B.B.、Flamary,R.、Courty,N.、Rolet,A.和Blondel,M.(2018年)。大规模最优运输和测绘估算。学习代表国际会议记录.
[82] Singh,S.和Póczos,B.(2018年)。Wasserstein距离的Minimax分布估计。预印。arXiv:1802.08855提供。
[83] Solomon,J.、de Goes,F.、Peyré,G.、Cuturi,M.、Butscher,A.、Nguyen,A.、Du,T.和Guibas,L.(2015)。卷积Wasserstein距离:几何域上的有效最优传输。ACM事务处理。图表。34 66:1-66:11. ·Zbl 1334.68267号 ·数字对象标识代码:10.1145/2766963
[84] Solomon,J.、Peyré,G.、Kim,V.G.和Sra,S.(2016)。对应问题的熵度量对齐。ACM事务处理。图表。35 72:1-72:13. ·doi:10.1145/2897824.2925903
[85] Staib,M.、Claici,S.、Solomon,J.M.和Jegelka,S.(2017年)。平行流Wasserstein重心。神经信息处理系统研究进展30:神经信息处理系统年会\(2017年,2017年12月4日至9日\),美国加利福尼亚州长滩2644-2655.
[86] Strauch,C.(2018)。各向异性类上遍历扩散的自适应不变密度估计。安。统计师。46 3451-3480. ·Zbl 1454.62249号 ·doi:10.1214/17-AOS1664
[87] Talagrand,M.(2014)。随机过程的上下限:现代方法与经典问题.Ergebnisse der Mathematik和Ihrer Grenzgebiete. 3.福克。现代数学调查系列[数学及相关领域成绩. 3rd系列] 60. 海德堡施普林格·Zbl 1293.60001号 ·doi:10.1007/978-3-642-54075-2
[88] Tameling,C.和Munk,A.(2018年)。基于经验最优运输的统计推断计算策略。2018年IEEE数据科学研讨会,DSW2018,瑞士洛桑,6月\(4-6, 2018 175-179\).
[89] Tanaka,K.、Mizuguchi,M.、Sekine,K.,Takayasu,A.和Oishi,S.(2013)。使用扩展算子估计Lipschitz域上的嵌入常数。JSST公司2013模拟技术国际会议.
[90] Triebel,H.(2006)。函数空间理论。.数学专著100.巴塞尔Birkhäuser。
[91] Tsybakov,A.B.(2009年)。非参数估计简介.统计学中的斯普林格系列纽约州施普林格。从2004年的法语原版开始修订和扩展。弗拉基米尔·扎亚茨译。 ·doi:10.1007/b13794
[92] van de Geer,S.(1987年)。最小二乘估计的新方法及其应用。安。统计师。15 587-602. ·兹比尔062562046 ·doi:10.1214/aos/1176350362
[93] van de Geer,S.(2002)\(M\)-使用惩罚或筛选进行估计。J.统计。计划。推断108 55-69. ·Zbl 1030.62026号 ·doi:10.1016/S0378-3758(02)00270-7
[94] Van der Vaart,A.W.(2000年)。渐近统计3.剑桥大学出版社,剑桥·Zbl 0943.6202号
[95] Villani,C.(2003年)。最佳运输主题.数学研究生课程58.阿默尔。数学。佛罗里达州普罗维登斯Soc·Zbl 1106.90001号 ·doi:10.1090/gsm/058
[96] Villani,C.(2009年)。最佳运输:旧的和新的.德国数学研究所[数学科学基本原理] 338. 柏林施普林格·Zbl 1156.53003号 ·doi:10.1007/978-3-540-71050-9
[97] Weed,J.和Bach,F.(2019年)。Wasserstein距离中经验测度的锐利渐近和有限样本收敛速度。伯努利25 2620-2648. ·Zbl 1428.62099号 ·doi:10.3150/18-BEJ1065
[98] Weed,J.和Berthet,Q.(2019年)。Wasserstein距离中平滑密度的估计。学习理论会议3118-3119.
[99] Yang,K.D.、Damodaran,K.、Venkatchalapathy,S.、Soylemezoglu,A.C.、Shivashankar,G.V.和Uhler,C.(2018年)。自动编码器和最佳传输,以推断生物过程的单细胞轨迹。生物Rxiv。网址:https://www.biorxiv.org/content/10.101/1455469v1。
[100] Yukich,J.E.(2006)。经典欧氏优化问题的概率论柏林施普林格。
[101] Zemel,Y.和Panaretos,V.M.(2019年)。Wasserstein空间中的Fréchet均值和Procrustes分析。伯努利25 932-976 ·Zbl 1431.62132号 ·doi:10.3150/17-bej1009
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。