×

支持点。 (英语) Zbl 1408.62030号

对于在(\mathbb{R}^p\)上具有有限均值的连续分布函数\(F\),作者介绍了一种构造\(F\)的一组代表点的新方法,称为支持点。这些被定义为那些点{x} _1个,\ldot,\mathbf{x} _n(n)\)最小化能量距离\(E(F,F_n)\),其中\(F_n\)是\(mathbf)的经验分布函数{x} _1个,\ldot,\mathbf{x} _n(n)\)能量距离定义为\[E(F,F_n)=2\mathbb{E}\|\mathbf{X}(X)-\mathbf{Y}\|_2-\mathbb{E}\|\mathbf{X}(X)-\mathbf{X}'\|_2-\mathbb{E}\|\mathbf{Y}(Y)-\mathbf{Y}'\|2\,,\]其中\(\mathbf{X},\mathbf{X}'\ overset{IID}{\sim}F\)和\(\mathbf{Y},\mathbf{Y}'\ overset{IID}{\sim}F_n \)。显示了这些支持点到\(F\)的分布收敛性。作者还建立了一个Koksma-Hlawka型不等式,给出了一大类被积函数(g)与(E(F,F_n))成正比的\(|intg(\mathbf{x}),d[F-F_n](\mathbf{x{)|^2的上界,同时给出了误差收敛速度的存在性结果,并讨论了支持点相对于现有蒙特卡罗方法在该误差率方面的优势。这些证明利用了欧氏距离幂与其傅里叶变换幂之间的对偶性。
还给出了两种生成支撑点的算法,并通过仿真说明了它们的使用。在这些模拟中,经验运行时间在维度(p)上几乎呈线性增长,在使用的支撑点数量(n)上呈二次增长。进一步的仿真表明,与其他方法相比,支持点在数值积分中可以提供更好的性能。本文最后讨论了两种应用;第一种方法是在昂贵的模拟中进行不确定性传播,第二种方法使用支持点作为贝叶斯计算中MCMC细化的替代方法。

MSC公司:

62E17型 统计分布的近似值(非共鸣)
60E05型 概率分布:一般理论
62甲12 多元分析中的估计
65天30分 数值积分
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ascher,U.M.和Greif,C.(2011年)。数值方法第一课程。计算科学与工程7。宾夕法尼亚州费城SIAM·Zbl 1232.65001号
[2] Bahouri,H.、Chemin,J.-Y.和Danchin,R.(2011)。傅里叶分析和非线性偏微分方程343。海德堡施普林格·Zbl 1227.35004号
[3] Borodachov,S.V.、Hardin,D.P.和Saff,E.B.(2014)。通过Riesz能量最小化离散流形的低复杂度方法。已找到。计算。数学14 1173-1208·Zbl 1304.31006号 ·doi:10.1007/s10208-014-9202-3
[4] Bousquet,O.和Bottou,L.(2008)。大规模学习的权衡。神经信息处理系统进展161-168。
[5] Carpenter,B.、Gelman,A.、Hoffman,M.、Lee,D.、Goodrich,B.、Betancourt,M.、Brubaker,M.A.、Guo,J.、Li,P.和Riddell,A.(2017)。斯坦:一种概率编程语言。《美国法律总汇》第76卷第1–32页。
[6] Cox,D.R.(1957)。关于分组的注释。J.Amer。统计师。协会52 543–547·Zbl 0088.35402号 ·doi:10.1080/016214591957.10501411
[7] Dalenius,T.(1950)。最优分层问题。扫描。演员。J.1950年203-213·Zbl 0041.46302号
[8] Dick,J.、Kuo,F.Y.和Sloan,I.H.(2013)。高维积分:准蒙特卡罗方法。《数字学报》22 133-288·Zbl 1296.65004号 ·doi:10.1017/S0962492913000044
[9] Dick,J.和Pillichshammer,F.(2010年)。数字网络和序列:差异理论和准蒙特卡罗积分。剑桥大学出版社,剑桥·Zbl 1282.65012号
[10] Di Nezza,E.、Palatucci,G.和Valdinoci,E.(2012年)。《徒步旅行者指南》(Hitchhicker’s guide to the fractional Sobolev spaces)。数学科学公报136 521–573·Zbl 1252.46023号 ·doi:10.1016/j.bulsci.2011.12.004
[11] Draper,N.R.和Smith,H.(1981年)。《应用回归分析》,第二版,威利出版社,纽约·Zbl 0548.62046号
[12] Fang,K.-T.(1980)。均匀设计:数理方法在实验设计中的应用。数学学报。申请。原罪3 363–372·Zbl 0473.62067号
[13] Fang,K.-T.,Lu,X.,Tang,Y.和Yin,J.(2004)。使用可分解的填料和覆盖物构建均匀设计。离散数学274 25–40·Zbl 1041.62065号 ·doi:10.1016/S0012-365X(03)00100-6
[14] Fang,K.-T.和Wang,Y.(1994)。数理统计方法。统计学和应用概率专著51。查普曼和霍尔,伦敦·Zbl 0925.65263号
[15] Flury,B.A.(1990年)。主要要点。生物特征77 33–41·Zbl 0691.62053号 ·doi:10.1093/biomet/77.1.33
[16] Gelfand,I.和Shilov,G.(1964年)。广义函数,第一卷:性质与运算。纽约学术出版社·Zbl 0115.33101号
[17] Genz,A.(1984)。测试多维集成例程。程序中。国际科学与工程计算工具、方法和语言会议81-94。北荷兰爱思唯尔。
[18] Geyer,C.J.(1992)。实用马尔可夫链蒙特卡罗法。统计师。科学7 473–483。
[19] Ghadimi,S.和Lan,G.(2013)。非凸随机规划的随机一阶和零阶方法。SIAM J.Optim.23 2341–2368·Zbl 1295.90026号 ·数字对象标识代码:10.1137/120880811
[20] Girolma,M.和Calderhead,B.(2011年)。黎曼流形朗之万和哈密顿蒙特卡罗方法。J.R.统计社会服务。B.Stat.方法73 123–214·Zbl 1411.62071号
[21] Graf,S.和Luschgy,H.(2000)。概率分布量化基础。施普林格,柏林·Zbl 0951.60003号
[22] Hickernell,F.J.(1998)。广义差分和求积误差界。数学。组件67 299–322·Zbl 0889.41025号 ·doi:10.1090/S0025-5718-98-00894-1
[23] Hickernell,F.J.(1999)。优秀的统计数据、差异和稳健的设计。统计师。普罗巴伯。第44页,73–78·Zbl 0940.62067号 ·doi:10.1016/S0167-7152(98)00293-4
[24] Hunter,J.K.和Nachtergaele,B.(2001年)。应用分析。新加坡世界科学·Zbl 0981.46002号
[25] Joe,S.和Kuo,F.Y.(2003年)。算法659的备注:实现Sobol的准随机序列发生器。ACM事务处理。数学。软件29 49–57·Zbl 1070.65501号 ·doi:10.1145/641876.641879
[26] Joseph,V.R.、Dasgupta,T.、Tuo,R.和Wu,C.F.J.(2015)。使用最小能量设计对复杂曲面进行连续勘探。技术计量57 64–74·doi:10.1080/00401706.2014.881749
[27] Joseph,V.R.、Gul,E.和Ba,S.(2015)。计算机实验的最大投影设计。生物特征102 371–380·Zbl 1452.62593号 ·doi:10.1093/biomet/asv002
[28] Kiefer,J.(1961)。向量机会变量经验df的大偏差和重对数律。太平洋数学杂志11 649–660·Zbl 0119.34904号 ·doi:10.2140/pjm.1961.11.649
[29] 科尔莫戈罗夫(1933)。Sulla determinazione experimenta delle leggi di probabilita公司。G.以色列。意大利语。Attuari4 1–11。
[30] Korolyuk,V.和Borovskikh,Y.V.(1989)。退化von Mises泛函的收敛速度。理论问题。申请33 125–135·Zbl 0668.60037号 ·doi:10.1137/1133012
[31] Kuo,F.Y.和Sloan,I.H.(2005)。解除维度的诅咒。通知Amer。数学。Soc.52 1320–1328·Zbl 1080.65020号
[32] Lange,K.(2016)。MM优化算法。费城SIAM·Zbl 1357.90002号
[33] Link,W.A.和Eaton,M.J.(2012年)。关于MCMC中链的减薄。方法经济学。进化3 112–115。
[34] Lipp,T.和Boyd,S.(2016年)。凹凸过程的变化和扩展。最佳方案。工程17 263–287·Zbl 1364.90260号 ·doi:10.1007/s11081-015-9294-x
[35] Lloyd,S.(1982)。PCM中的最小二乘量化。IEEE传输。通知。理论28 129–137·Zbl 0504.94015号 ·doi:10.1109/TIT.1982.1056489
[36] Mairal,J.(2013)。大规模优化的随机优化最小化算法。神经信息处理系统进展2283–2291。
[37] Mak,S.和Joseph,V.R.(2018年)。使用聚类的极小极大和极小极大投影设计。计算杂志。图表。统计数字.27 166-178·Zbl 07498976号
[38] Mak,S.和Joseph,V.R(2018年)。“支持点”补充。DOI:10.1214/17-AOS1629SUPP。
[39] Mak,S.、Sung,C.-L.、Wang,X.、Yeh,S.-T.、Chang,Y.-H.、Joseph,V.R.、Yang,V.和Wu,C.F.J.(2017)。一种用于大涡模拟的模拟和物理提取的有效代理模型。预印。可从arXiv:1611.07911获取。
[40] Mak,S.和Xie,Y.(2017)。噪声矩阵补全的不确定性量化和设计——一个统一的框架。预印本。arXiv:1706.08037。
[41] Matsumoto,M.和Nishimura,T.(1998年)。梅森捻线器:623维均匀分布伪随机数发生器。ACM事务处理。模型。计算。模拟8 3–30·Zbl 0917.65005号 ·doi:10.1145/272991.272995
[42] Nichols,J.A.和Kuo,F.Y.(2014)。随机移位格规则的快速CBC构造实现了POD加权空间中(mathbb{R}^{s})上无界被积函数的(mathcal{O}(n^{-1+δ})收敛。J.复杂性30 444–468·兹比尔1302.65016 ·doi:10.1016/j.jco.2014.02.004
[43] Niederreiter,H.(1992)。随机数生成和准蒙特卡罗方法。CBMS-NSF应用数学区域会议系列63。宾夕法尼亚州费城SIAM·Zbl 0761.65002号
[44] Nuyens,D.和Cools,R.(2006年)。移位不变再生核Hilbert空间中秩-1格规则逐分量构造的快速算法。数学。组件75 903–920·兹比尔1094.65004 ·doi:10.1090/S0025-5718-06-01785-6
[45] Ortega,J.M.和Rheinboldt,W.C.(2000)。多元非线性方程的迭代解法。费城SIAM·Zbl 0949.65053号
[46] Owen,A.B.(1998年)。争夺Sobol'和Niederreiter–Xing分。《复杂性杂志》14 466–489·Zbl 0916.65017号 ·doi:10.1006/jcom.1998.0487
[47] Owen,A.B.和Tribble,S.D.(2005年)。准蒙特卡罗大都会算法。程序。国家。阿卡德。科学。美国102 8844–8849·Zbl 1135.65001号 ·doi:10.1073/pnas.0409596102
[48] Pagès,G.、Pham,H.和Printems,J.(2004年)。最优量化方法及其在金融数值问题中的应用。《金融计算和数值方法手册》253-297。Birkhäuser,马萨诸塞州波士顿·Zbl 1138.91467号
[49] Paley,R.和Zygmund,A.(1930年)。关于一些系列函数。《剑桥哲学学会数学学报》26 337-357。剑桥大学出版社,剑桥。 ·doi:10.1017/S0305004100016078
[50] R核心团队(2017)。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[51] Resnick,S.I.(2014)。概率路径。Birkhäuser/Springer,纽约·Zbl 1280.60001号
[52] Rosenblatt,M.(1952年)。关于多元变换的备注。安。数学。统计数据23 470–472·Zbl 0047.13104号 ·doi:10.1214/aoms/1177729394
[53] Royden,H.L.和Fitzpatrick,P.(2010年)。实际分析。纽约麦克米伦·Zbl 1191.26002号
[54] Santner,T.J.、Williams,B.J.和Notz,W.I.(2013)。计算机实验的设计与分析。施普林格,纽约·Zbl 1041.62068号
[55] Serfling,R.J.(2009)。数理统计的逼近定理。纽约威利·Zbl 0538.62002号
[56] Shorack,G.R.(2000)。统计学家的概率。施普林格,纽约·Zbl 0951.62005号
[57] Sloan,I.H.、Kuo,F.Y.和Joe,S.(2002年)。在加权Sobolev空间中构造随机移位格规则。SIAM J.数字。分析40 1650–1665·Zbl 1037.65005号 ·doi:10.1137/S0036142901393942
[58] Sobol',I.M.(1967年)。立方体中点的分布和积分的近似计算。Ž. 维奇岛。Mat.i Mat.Fiz.7 784–802。
[59] 苏勇(2000)。二元随机向量的渐近最优代表点。统计师。中国10 559–576·Zbl 1054.62066号
[60] Székely,G.J.和Rizzo,M.L.(2004)。高维均匀分布测试。国际统计1–6。
[61] Székely,G.J.和Rizzo,M.L.(2013)。能量统计:一类基于距离的统计。J.统计。计划。推断143 1249–1272·Zbl 1278.62072号 ·doi:10.1016/j.jspi.2013.03.018
[62] Tao,P.D.和An,L.T.H.(1997)。DC编程的凸分析方法:理论、算法和应用。数学学报。越南22 289–355·Zbl 0895.90152号
[63] Tuy,H.(1986)。通过dc编程实现全局优化的通用确定性方法。《FERMAT第85天:优化数学》(J.B.Hiriart-Urruti编辑)。北荷兰数学研究129 137–162。荷兰北部,阿姆斯特丹·Zbl 0623.65067号
[64] Tuy,H.(1995)。DC优化:理论、方法和算法。《全局优化手册》149-216。施普林格,柏林·Zbl 0832.90111号
[65] Wendland,H.(2005)。分散数据近似。剑桥大学出版社,剑桥·Zbl 1075.65021号
[66] Yuille,A.L.和Rangarajan,A.(2003)。凹-凸过程。神经计算15 915–936·Zbl 1022.68112号 ·doi:10.1162/08997660360581958
[67] P.扎多尔·Zbl 0476.94008号 ·doi:10.1109/TIT.1982.1056490
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。