×

基于Wasserstein距离的样本外推断。 (英语) Zbl 1472.90077号

摘要:我们提出了一种新的推理方法,称之为样本外推理。该方法可以广泛应用,从半监督学习到压力测试,它是数据驱动分布式稳健优化应用的基础。我们的方法能够在给定的利益绩效衡量中衡量合理的样本外情景的影响,例如财务损失。该方法受到经验似然(EL)的启发,但我们优化了观测值所诱导的经验Wasserstein距离(而不是经验似然)。从方法论的观点来看,我们对诱导的Wasserstein距离剖面函数的渐近行为的分析表明,相对于EL,存在显著的质量差异。例如,与EL相反,EL通常会产生chi-square弱收敛极限,我们的渐近分布通常不是chi-squared。此外,我们获得的收敛速度在很大程度上依赖于维数,但随着维数的增加,收敛速度仍保持可控。

理学硕士:

90立方厘米 数学规划中的稳健性
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Antoine B、Bonnal H和Renault E(2007)《关于有效使用估算方程的信息含量:隐含概率和欧几里德经验似然》。J.计量经济学138(2):461-487.Crossref,谷歌学者·Zbl 1418.62101号 ·doi:10.1016/j.jeconom.2006.05.005
[2] Bayraksan G,Love DK(2015)使用phi发散的数据驱动随机规划。运筹学革命(信息),1-19。谷歌学者
[3] Beiglböck M,Siorpaes P(2015)Burkholder-Davis-Gundy不等式的路径版本。伯努利21(1):360-373谷歌学者·Zbl 1352.60060号
[4] Ben Tal A,Den Hertog D,De Waegenaere A,Melenberg B,Rennen G(2013)受不确定概率影响的优化问题的鲁棒解。管理科学。59(2):341-357.链接,谷歌学者
[5] Blake C,Merz CJ(1998)机器学习数据库的Uci存储库。谷歌学者
[6] Blanchet J,Kang Y(2017)分布稳健的群体正则化估计量。程序。机器学习研究。77:97-112.谷歌学者
[7] Blanchet J,Kang Y(2020)基于分布稳健优化的半监督学习。数据分析与应用3:计算、分类、财务、统计和随机方法,第5卷,1-33。谷歌学者
[8] Blanchet J,Murthy K(2019)通过最优运输量化分配模型风险。数学。操作。物件。44(2):565-600.Link,谷歌学者·Zbl 1434.60113号
[9] Blanchet J,Kang Y,Murthy K(2019b)鲁棒wasserstein轮廓推理及其在机器学习中的应用。J.应用。可能性56(3):830-857.Crossref,谷歌学者·Zbl 1436.62336号 ·doi:10.1017/jpr.2019.49
[10] Blanchet J,Kang Y,Zhang F,Hu Z(2019c)分布式鲁棒升压算法。程序。2019年冬季模拟大会(WSC),3728-3739。谷歌学者
[11] Blanchet J,Kang Y,Zhang F,Murthy K(2019d)用于分布稳健优化的数据驱动最优运输成本选择。程序。2019年冬季模拟大会(WSC),3740-3751.谷歌学者
[12] Blanchet J,Kang Y,Zhang F,He F,Hu Z(2019e)双稳健数据驱动分布式稳健优化。程序。第18届国际应用随机模型和数据分析。与人口统计学研讨会的冲突,249-262谷歌学者
[13] Bravo F(2004)经验似然推理及其在一些计量经济学模型中的应用。计量经济学理论20(02):231-264.Crossref,谷歌学者·Zbl 1072.62016年 ·doi:10.1017/S02664666042018年
[14] Chen SX(1993)关于线性回归模型经验似然置信区的准确性。安.Instit。统计师。数学。45(4):621-637.Crossref,谷歌学者·Zbl 0799.62070号 ·doi:10.1007/BF00774777
[15] Chen SX,Keilegom IV(2009)回归的经验似然方法综述。测试18(3):415-447谷歌学者·Zbl 1203.62035号
[16] Chen Z,Kuhn D,Wiesemann W(2018)关于Wasserstein球的数据驱动机会约束程序。预印本,2018年9月1日提交,https://arxiv.org/abs/1809.00210.谷歌学者
[17] Dua D,Graff C(2019)UCI机器学习库。http://archive.ics.uci.edu/ml.谷歌学者
[18] Duchi J,Namkoong H(2018)通过分布稳健优化实现统一性能的学习模型。预印本,2020年7月18日提交,https://arxiv.org/abs/1810.08750.谷歌学者
[19] Duchi J,Glynn P,Namkoong H(2016)稳健优化统计:广义经验似然法。预印本,2018年6月30日提交,https://arxiv.org/abs/1610.03425.谷歌学者
[20] Einmahl JH,McKeague IW(1999)《通过经验似然的多分位数图的置信管》。安。统计师。27(4):1348-1367.Crossref,谷歌学者·Zbl 0957.62038号 ·doi:10.1214/aos/1017938929
[21] Esfahani PM,Kuhn D(2018)《使用Wasserstein度量的数据驱动分布式稳健优化:性能保证和可控制的重新设计》。数学。编程171(1-2):115-166.Crossref,谷歌学者·Zbl 1433.90095 ·doi:10.1007/s10107-017-1172-1
[22] Gao R,Kleywegt AJ(2016)具有Wasserstein距离的分布鲁棒随机优化。预印本,2016年7月16日提交,https://arxiv.org/abs/1604.02199。谷歌学者
[23] Gao R,Xie L,Xie Y,Xu H(2018)利用Wasserstein不确定性集进行稳健假设检验。神经信息处理系统进展,7902-7912。谷歌学者
[24] 州长联邦储备系统(2019)年度报告。2021年2月1日访问,https://www.federalreserve.gov/publications/annual-report.htm.谷歌学者
[25] Guggenberger P(2008)有限样本证据表明广义经验似然估计存在重尾问题。计量经济学评论。27(4-6):526-541.Crossref,谷歌学者·Zbl 1140.62025号 ·doi:10.1080/077474930801960410
[26] Hastie T、Tibshirani R、Friedman J、Franklin J(2005)《统计学习的要素:数据挖掘、推理和预测》。数学。智能手机27(2):83-85.Crossref,谷歌学者·doi:10.1007/BF02985802
[27] Hollander M,McKeague IW(1997)生存函数基于似然比的置信带。J.Amer。统计师。协会。92(437):215-226.Crossref,谷歌学者·兹比尔1090.62560 ·doi:10.1080/01621459.1997.10473619
[28] Hu W,Niu G,Sato I,Sugiyama M(2018)分布式鲁棒监督学习是否能提供鲁棒分类器?国际。机器学习会议,2034-2042年谷歌学者
[29] Imbens GW(2012)矩的广义方法和经验似然。J.总线。经济。统计师20(4):493-506.Crossref,谷歌学者·doi:10.1198/073500102288618630
[30] Kitamura Y(2007)《计量经济学中的经验似然方法:理论与实践》。Blundell R,Newey W,Persson T,eds.《经济学和计量经济学进展:理论和应用》,第九届世界大会(计量经济学社会专著(剑桥大学出版社,剑桥),174-237。谷歌学者·Zbl 1131.62106号
[31] Lam H,Zhou E(2015)《样本平均近似中的量化不确定性》。2015年冬季模拟大会(WSC),3846-3857.谷歌学者
[32] Lam H,Zhou E(2017)量化样本平均近似中不确定性的经验似然方法。操作。Res.Lett公司。45(4):301-307.Crossref,谷歌学者·Zbl 1409.62073号 ·doi:10.1016/j.orl.2017.04.003
[33] Li G,Qin J,Tiwari RC(1997)基于半参数似然比的截断数据推断。J.Amer。统计师。协会。92(437):236-245.Crossref,谷歌学者·Zbl 0889.62025号 ·doi:10.1080/01621459.1997.10473621
[34] Li G,Hollander M,McKeague IW,Yang J(1996)不完全生存数据分位数函数的非参数似然比置信带。安。统计师。24(2):628-640.谷歌学者交叉引用·兹比尔0859.62047 ·doi:10.1214/aos/1032894455
[35] Luenberger DG(1973)线性和非线性规划导论第28卷(Addison-Wesley,Reading,MA)。谷歌学者·Zbl 0297.90044号
[36] Mohajerin Esfahani P,Kuhn D(2018)《使用Wasserstein度量的数据驱动分布式稳健优化:性能保证和可控制的重新制定》。数学。编程171(1):115-166。谷歌学者·Zbl 1433.90095
[37] Murphy SA(1995)生存分析中基于似然比的置信区间。J.Amer。统计师。协会。90(432):1399-1405.谷歌学者Crossref·Zbl 0868.62041号 ·doi:10.1080/01621459.1995.10476645
[38] Newey WK,Smith RJ(2004)GMM的高阶性质和广义经验似然估计。计量经济学72(1):219-255.Crossref,谷歌学者·兹比尔1151.62313 ·doi:10.1111/j.1468-0262.2004.00482.x号文件
[39] Owen A(1988)单函数的经验似然比置信区间。生物特征75(2):237-249.Crossref,谷歌学者·Zbl 0641.62032号 ·doi:10.1093/生物技术/75.2237
[40] Owen A(1990)经验似然比置信区。安。统计师。18(1):90-120.谷歌学者(Google Scholar)交叉引用·Zbl 0712.62040号 ·doi:10.1214/aos/1176347494
[41] Owen A(1991)线性模型的经验似然。安。统计师。19(4):1725-1747.Crossref,谷歌学者·Zbl 0799.62048号 ·doi:10.1214/aos/1176348368
[42] 欧文A(2001)经验可能性(佛罗里达州博卡拉顿CRC出版社)。Crossref,谷歌学者·Zbl 0989.62019 ·doi:10.1201/9781420036152
[43] 秦J,Lawless J(1995)估计方程,经验似然和参数约束。加拿大J.Stat。23(2):145-159。Crossref,谷歌学者·Zbl 0839.62059号 ·doi:10.2307/3315441
[44] 鲁丁·W(1964)数学分析原理,第3卷(McGraw-Hill,纽约)。谷歌学者·Zbl 0148.02903号
[45] Ruszczynski AP,Shapiro A(2003)随机规划第10卷(爱思唯尔,阿姆斯特丹)。Crossref,谷歌学者·Zbl 1115.90001号 ·doi:10.1016/S0927-0507(03)10001-1
[46] Shafieezadeh-Abadeh S,Esfahani PM,Kuhn D(2015)分布鲁棒逻辑回归《神经信息处理系统进展》,第28卷(Curran Associates,Inc.),1576-1584.谷歌学者
[47] Shapiro A,Dentcheva D(2014)随机规划讲座:建模与理论第16卷(SIAM,费城)。Crossref,谷歌学者·doi:10.137/1.9781611973433
[48] Sinha A、Namkoong H、Duchi J(2018)《可认证的分布式鲁棒性与原则性对抗训练》。国际。关于学习表现的争论。谷歌学者
[49] 维拉尼C(2008)最佳交通:新旧(Springer Science&Business Media,纽约)。谷歌学者
[50] Volpi R、Namkoong H、Sener O、Duchi JC、Murino V、Savarese S(2018),通过对抗性数据增强对未知领域进行概括。神经信息处理系统研究进展5334-5344.谷歌学者
[51] Wang Q,Rao JNK(2001)缺失响应插补下线性回归模型的经验似然。加拿大统计学家J。29(4):597-608.Crossref,谷歌学者·Zbl 0994.62060号 ·doi:10.2307/3316009
[52] Wang Z,Glynn PW,Ye Y(2009)数据驱动新闻供应商问题的似然稳健优化。计算。管理科学。13(2):241-261谷歌学者·Zbl 1397.90225号
[53] Wilks SS(1938)检验复合假设的似然比的大样本分布。安。数学。统计师。9(1):60-62.Crossref,谷歌学者·doi:10.1214/aoms/1177732360
[54] Yang I(2017)基于wasserstein距离的分布稳健马氏决策过程的凸优化方法。IEEE控制系统说明书。1(1):164-169。Crossref,谷歌学者·doi:10.1109/LCSYS.2017.2711553
[55] Zhao C,Guan Y(2018)Wasserstein度量的数据驱动风险规避随机优化。操作。Res.Lett公司。46(2):262-267.谷歌学者·Zbl 1525.90316号
[56] Zhao Y,Wang H(2008)删失数据下平均质量调整寿命回归模型的经验似然推断。加拿大统计学家J。36(3):463-478.Crossref,谷歌学者·Zbl 1153.62038号 ·doi:10.1002/cjs.5550360309
[57] 周M(2015)生存分析中的经验似然法第79卷(CRC出版社,佛罗里达州博卡拉顿)。Crossref,谷歌学者·doi:10.1201/b18598
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。