×

一般空间实验设计中的比例体积采样。 (英语) Zbl 1502.62022号

摘要:线性回归的优化设计是统计学中的一项基本任务。对于有限设计空间,最近的进展表明,随机设计使用比例体积取样(简称PVS)导致多项式时间算法的近似保证优于i.i.d.采样。PVS在共同填充设计空间的设计节点之间取得了平衡,同时在原始问题的放松凸版本的解决方案下,略微停留在高质量区域。在本文中,我们研究了PVS的一种新变体对(可能是贝叶斯)优化设计的一些统计意义。使用点处理机械,我们处理通用波兰设计空间的情况。我们表明,不仅保留了已知的A-最优近似保证,而且我们还获得了D-最优设计的类似保证,从而巩固了最近的结果。此外,我们还证明了我们的PVS变量可以在多项式时间内采样。不幸的是,尽管它优雅且易于处理,但我们在一个简单的例子中证明,一般PVS的实际意义可能是有限的。在本文的第二部分中,我们重点讨论了应用,并研究了PVS作为随机搜索启发式子程序的使用。我们证明了PVS是对从业者工具箱的一个强大补充,特别是当回归函数是非标准的,并且设计空间虽然低维,但形状复杂(例如非线性边界、几个相连的组件)时。

MSC公司:

62-08 统计学相关问题的计算方法
62J05型 线性回归;混合模型
62克05 最佳统计设计
60G55型 点过程(例如,泊松、考克斯、霍克斯过程)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andersen,M.,Dahl,J.,Liu,Z.,Vandenberghe,L.:大规模锥规划的内点方法。摘自:Sra,S.、Nowozin,S.和Wright,S.(编辑)《机器学习优化》,麻省理工学院出版社,第1章,第55-83页(2012年)
[2] 阿特金森,A。;Donev,A。;Tobias,R.,最优实验设计,与SAS(2007),牛津:牛津大学出版社,牛津统计科学丛书,牛津·兹比尔1183.62129
[3] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),美国:剑桥大学出版社,美国·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[4] 科林斯,BJ,《对角展开的特征多项式》,《美国统计》,第37、3、233-235页(1983年)
[5] DJ Daley;Vere-Jones,D.,《点过程理论导论》(2003),纽约:斯普林格出版社,纽约·Zbl 1026.60061号
[6] 德卡斯特罗,Y。;Gamboa,F。;亨利安,D。;赫斯·R。;Lasserre,J.,《多元多项式回归的近似最优设计》,《Ann.Stat.》,47,1,127-155(2019)·Zbl 1417.62219号 ·doi:10.1214/18-AOS1683
[7] Dereziñski,M.、Warmuth,M.和Hsu,D.:线性回归的杠杆体积采样。在:神经信息处理系统的进展31:神经信息处理系统年会,第2510-2519页(2018)
[8] Dereziñski,M.、Warmuth,M.和Hsu,D.:随机设计回归的无偏估计。ArXiv预打印(2019年)
[9] Dereziñski,M.,Liang,F.,Mahoney,M.:使用正则行列式点过程的贝叶斯实验设计。In:Chiappa,S.,Calandra,R.(Eds.)《第二十三届国际人工智能与统计会议论文集》,PMLR,在线,《机器学习研究论文集》第108卷,第3197-3207页(2020)
[10] 德里津斯基,M。;Mahoney,M.,随机数值线性代数中的行列式点过程,Not。美国数学。Soc.,68,1(2021年)·兹比尔1454.60063 ·doi:10.1090/noti2202
[11] Dette,H.,线性回归模型中的贝叶斯d-最优和模型稳健设计,统计:J.Theor。申请。Stat.,25,1,27-46(1993)·Zbl 0816.62054号 ·doi:10.1080/02331889308802429
[12] Dette,H。;WJ Studden,《典型矩理论及其在统计、概率和分析中的应用》(1997),霍博肯:概率统计中的威利级数,威利·Zbl 0886.62002号
[13] Dette,H。;梅拉斯,V。;Pepelyshev,A.,部分圆上三角回归模型的D-最优设计,Ann.Inst.Stat.Math。,54, 945-959 (2002) ·Zbl 1045.62075号 ·doi:10.1023/A:1022436007242
[14] Dick,J。;Pilichchammer,F.,《数字网络和序列》。差异理论与准蒙特卡罗积分(2010),剑桥:剑桥大学出版社,剑桥·Zbl 1282.65012号 ·doi:10.1017/CBO9780511761188
[15] 方,K。;李,R。;Sudjianto,A.,《计算机实验的设计和建模》(2006),博卡拉顿:查普曼和霍尔/CRC,博卡拉顿·Zbl 1093.62117号
[16] Farrell,R.H.,Kiefer,J.,Walbran,A.:最佳多元设计。摘自:《第五届伯克利数理统计与概率研讨会论文集》,1:统计学,加利福尼亚大学出版社,第113-138页(1967年)·Zbl 0193.17101号
[17] Fedorov,V.,《最佳实验设计理论》(1972),纽约:学术出版社,纽约
[18] Gautier,G.,Bardenet,R.,Valko,M.:关于蒙特卡罗积分中使用行列式点过程的两种方法。ICML机器学习负依赖研讨会技术代表(2019a)
[19] Gautier,G.,Polito,G.、Bardenet,R.、Valko,M.:DPPy:使用Python的DPP采样。机器学习研究杂志-机器学习开源软件(JMLR-MLOSS)(2019b)
[20] Grove,D.,Woods,D.,Lewis,S.:发动机台架试验设计中的多因素b样条混合模型。J.资格。Technol公司。36(4), 380-391 (2004)
[21] 霍夫,J。;克里希纳普尔,M。;佩雷斯,Y。;Virag,B.,《高斯分析函数和行列式点过程的零点》(2009),普罗维登斯:美国数学学会,普罗维登斯·Zbl 1190.60038号 ·doi:10.1090/ulect/051
[22] 巴蒂斯特·霍夫。,Krishnapur,M.,Peres,Y.,Virág,B.:决定性过程和独立性。概率调查(2006年)·Zbl 1189.60101号
[23] Johansson,K.,《随机矩阵和行列式过程》,Les Houches暑期学校学报。,83,C,1-56(2006)·Zbl 1411.60144号
[24] Kulesza,A.,Taskar,B.:机器学习的决定点过程。机器学习的基础和趋势(2012年)·Zbl 1278.68240号
[25] Lavancier,F。;莫勒,J。;Rubak,E.,决定点过程模型和统计推断,J.R.Stat.Soc.:Ser。B(Stat.Methodol.),77,853-877(2015)·Zbl 1414.62403号 ·doi:10.1111/rssb.12096
[26] Liski,E.,Mandal,N.,Shah,K.,Sinha,Ba.:优化设计主题,第1版。统计讲座笔记163,纽约斯普林格(2002)·Zbl 0985.62057号
[27] 刘,X。;岳,RX;Chatterjee,K.,随机系数回归模型d-最优设计的几何特征,统计学。普罗巴伯。莱特。,159 (2020) ·Zbl 1436.62378号 ·doi:10.1016/j.spl.2019.108696
[28] Macchi,O.,随机点过程的重合方法,高级应用。概率。,7, 83-122 (1975) ·Zbl 0366.60081号 ·doi:10.2307/1425855
[29] Maronge,J。;翟毅。;维恩斯,D。;Fang,Z.,样条小波回归模型的优化设计,J.Stat.Plann。推理,18494-104(2017)·Zbl 1359.62319号 ·doi:10.1016/j.jspi.2016.11.005
[30] Nikolov,A.、Singh,M.、Tantipongpipat,UT.:用于A-最优设计的比例体积采样和近似算法。摘自:第三十届ACM-SIAM离散算法年会论文集,工业和应用数学学会,SODA’19,1369-1386(2019)·Zbl 1431.68156号
[31] 皮佩尔,G。;斯坦菲尔,B。;库利,S。;琼斯,B。;Kroll,J。;Vienna,J.,当组件受到线性和非线性约束时,开发空间填充混合物实验设计,Qual。工程,31,3,463-472(2019)·doi:10.1080/08982112.2018.1517887
[32] Pronzato,L。;Pázman,A.,非线性模型实验设计:渐近正态性、最优准则和小样本性质(2013),纽约:Springer Verlag,纽约·Zbl 1275.62026号
[33] Pukelsheim,F.:实验的优化设计。应用数学经典50,工业和应用数学学会(2006)·Zbl 1101.62063号
[34] Pukelsheim,F。;Rieder,S.,近似设计的有效四舍五入,Biometrika,79,4,763-770(1992)·doi:10.1093/biomet/79.4.763
[35] CP罗伯特;Casella,G.,Monte Carlo统计方法(2004),纽约:Springer,纽约·Zbl 1096.62003年 ·doi:10.1007/978-1-4757-4145-2
[36] Summa,M.,Eisenbrand,F.,Faenza,Y.,Moldenhauer,C.:关于最大体积单纯形和子行列式。附:2015(2014)年度ACM-SIAM离散算法研讨会论文集·Zbl 1371.68290号
[37] Virtanen,P。;Gommers,R。;Oliphant,T.,SciPy 1.0:python中科学计算的基本算法,《自然方法》,17,261-272(2020)·doi:10.1038/s41592-019-0686-2
[38] 伍兹,D。;刘易斯,S。;Dewynne,J.,《多变量b样条模型的设计实验》,Sankhya,65,660-670(2003)·兹比尔1193.62150
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。