×

Daisee:通过平衡探索和开发实现自适应重要性抽样。 (英语) Zbl 07748387号

摘要:我们将自适应重要性抽样(AIS)作为一个在线学习问题进行研究,并论证了在这种适应中探索和利用之间权衡的重要性。借鉴在线学习文献的思想,我们提出了一种基于分区的AIS算法Daisee。我们进一步引入了AIS的遗憾概念,并表明Daisee具有(mathcal{O}(\sqrt{T}(\log T)^{frac{3}{4}})累积伪重报,其中\(T\)是迭代次数。然后,我们扩展Daisee以自适应地学习样本空间的层次划分,以实现更高效的采样,并通过经验验证两种算法的性能。
{©2023斯堪的纳维亚统计杂志基金会董事会。}

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agrawal,S.和Goyal,N.(2012年)。多武装匪徒问题的汤普森抽样分析。JMLR:研讨会和会议记录,23,39.1-39.26。
[2] 阿基尔迪兹。D.,&Míguez,J.(2021)。优化自适应重要性采样器的收敛速度。统计与计算,31,1-17·兹比尔1461.62010
[3] Auer,P.、Cesa‐Bianchi,N.和Fischer,P.(2002)。多武器匪徒问题的有限时间分析。机器学习,47,235-256·Zbl 1012.68093号
[4] Azuma,K.(1967年)。某些相依随机变量的加权和。《东北数学杂志》,第二辑,19357-367·Zbl 0178.21103号
[5] Balsubramani,A.(2014)。尖锐的有限时间重对数鞅集中。arXiv预打印arXiv:1405.2639。
[6] Berry,D.A.和Fristedt,B.(1985年)。强盗问题:实验的顺序分配。斯普林格·Zbl 0659.62086号
[7] Bubeck,S.、Cesa‐Bianchi,N.等人(2012年)。随机和非随机多武装匪徒问题的遗憾分析。机器学习的基础和趋势,5,1-122·Zbl 1281.91051号
[8] Bugallo,M.F.、Elvira,V.、Martino,L.、Luengo,D.、Miguez,J.和Djuric,P.M.(2017)。自适应重要性抽样:过去、现在和未来。IEEE信号处理杂志,34,60-79。
[9] Cappé,O.、Guillin,A.、Marin,J.‐M.和Robert,C.P.(2004)。人口蒙特卡洛。计算与图形统计杂志,13907-929。
[10] Cappé,O.、Douc,R.、Guillin,A.、Marin,J.‐M.和Robert,C.P.(2008)。一般混合类中的自适应重要性抽样。统计与计算,18,447-459。
[11] Carpentier,A.和Munos,R.(2011年)。蒙特卡罗分层抽样的有限时间分析。《神经信息处理系统进展》(第1278-1286页)。NeurIPS程序。
[12] Chatterjee,S.和Diaconis,P.(2015)。重要性抽样所需的样本量。arXiv预打印arXiv:1511.01437。
[13] Cichocki,A.和Amari,S.‐I。(2010). α-β-和γ-分歧家族:灵活而稳健的相似性度量。《熵》,第12期,1532-1568页·Zbl 1229.94030号
[14] Combes,R.、Magurenu,S.和Proutiere,A.(2017年)。在结构化随机土匪中进行最少的探索。在I.Guyon(编辑)、U.V.Luxburg(编辑)和S.Bengio(编辑)中,H.Wallach(编辑),R.Fergus(编辑)。Curran Associates公司。https://proceedings.neurips.cc/paper/2017/file/e19347e1c3ca0c0b97de5fb3b690855a‐纸张.pdf
[15] 科努特,J.,马林,J.‐M。,Mira,A.和Robert,C.P.(2012年)。自适应多重重要性抽样。《斯堪的纳维亚统计杂志》,39,798-812·Zbl 1319.62059号
[16] Doucet,A.、De Freitas,N.和Gordon,N.J.(2001a)。实践中的序贯蒙特卡罗方法(第1卷)。斯普林格·Zbl 0967.00022号
[17] Doucet,A.、De Freitas,N.和Gordon,N.J.(2001b)。序贯蒙特卡罗方法简介。在Doucet,A.、de Freitas,N.和Gordon,N.(编辑),《序贯蒙特卡罗方法在实践中的应用》(第3-14页)。斯普林格·Zbl 1056.93576号
[18] Elvira,V.和Chouzenoux,E.(2019年)。蒙特卡罗人口中基于朗之万的有效提案适应策略。ICASSP 2019-2019 IEEE声学、语音和信号处理国际会议(ICASSP)(第5077-5081页)。电气与电子工程师协会。
[19] Elvira,V.和Martino,L.(2021)。重要性抽样的进展。arXiv预打印arXiv:2102.05407。
[20] Elvira,V.、Martino,L.、Luengo,D.和Corander,J.(2015)。梯度自适应人口重要性采样器。2015年IEEE声学、语音和信号处理国际会议(ICASSP)(第4075-4079页)。电气与电子工程师协会。
[21] Elvira,V.、Martino,L.、Luengo,D.和Bugallo,M.F.(2017年)。改进总体蒙特卡罗:替代加权和重采样方案。信号处理,13177-91。
[22] Elvira,V.、Martino,L.、Luengo,D.和Bugallo,M.F.(2019年)。广义多重重要性抽样。统计科学,34129-155·Zbl 1420.62038号
[23] Fasiolo,M.、deMelo,F.E.和Maskell,S.(2018年)。朗之万增量混合物重要性抽样。统计与计算,28549-561·兹伯利1384.65012
[24] Friedman,J.H.(1991)。多元自适应回归样条。《统计年鉴》,第1期,第1-67页·Zbl 0765.62064号
[25] Gilks,W.R.、Richardson,S.和Spiegelhalter,D.(1995)。马尔可夫链蒙特卡罗法在实践中的应用。CRC出版社·Zbl 0832.00018号
[26] He,H.Y.和Owen,A.B.(2014)。多重重要抽样中的最优混合权重。arXiv预打印arXiv:1411.3954。
[27] James,F.(1980)。蒙特卡洛理论与实践。物理学进展报告,431145。
[28] Kahn,H.和Harris,T.E.(1951年)。通过随机采样估计粒子传输。国家标准局应用数学丛书,12,27-30。
[29] Koblents,E.和Míguez,J.(2013)。鲁棒混合种群蒙特卡罗方法,具有自适应分量数。第21届欧洲信号处理会议(EUSIPCO 2013)(第1-5页)。电气与电子工程师协会。
[30] Koolen,W.M.(2017)。迭代对数结果的快速而肮脏的有限时间法则。检索自。http://blog.wouterkoolen.info/QnD_LIL/post.html
[31] Kschichang,F.R.(2017)。互补误差函数。检索自。http://www.comm.utoronto.ca/frank/notes/erfc.pdf
[32] Lai,T.L.和Robbins,H.(1985)。渐进有效的自适应分配规则。应用数学进展,6,4-22·Zbl 0568.62074号
[33] Lattimore,T.和Szepesvari,C.(2020年)。班迪特算法。托拉蒂莫尔·Zbl 1439.68002号
[34] Lepage,G.P.(1978年)。一种新的自适应多维积分算法。计算物理杂志,27192-203·兹伯利0377.65010
[35] Leprêtre,F.、Teytaud,F.和Dehos,J.(2017)。分层抽样的多武器强盗:数值积分的应用[会议演示]。TAAI 2017——人工智能技术与应用会议,台湾台北,IEEE。
[36] Liang,F.、Liu,C.和Carroll,R.(2011)。高级马尔可夫链蒙特卡罗方法:从过去的样本中学习。约翰·威利父子公司。
[37] Lindenstrauss,J.(2013)。约翰逊-林登斯特劳斯理论。检索自。http://lear.irialpes.fr/people/harchaoui/teaching/2013‐2014/ensl/m2/lecture6.pdf
[38] Liu,J.S.(2008)。科学计算中的蒙特卡罗策略。施普林格科技与商业媒体·Zbl 1132.65003号
[39] Martino,L.、Elvira,V.、Luengo,D.和Corander,J.(2017年)。分层自适应重要性采样。统计与计算,27599-623·Zbl 1505.62276号
[40] Martino,L.、Elvira,V.和Camps‐Valls,G.(2018年)。粒子滤波和mcmc的组重要性抽样。数字信号处理,82,133-151。
[41] Martino,L.、Elvira,V.、López‐Santiago,J.和Camps‐Valls,G.(2021年)。用于天文和遥感中应用的昂贵模型的压缩粒子方法。IEEE航空航天和电子系统汇刊,572607-2621。
[42] Míguez,J.(2017)。非线性重要性采样器和总体蒙特卡罗方案的性能[会议演示]。2017年第22届数字信号处理国际会议(DSP),IEEE,英国伦敦,1-5。
[43] Mousavi,A.、Monsefi,R.和Elvira,V.(2021)。哈密顿自适应重要性抽样。IEEE信号处理信件,28713-717。
[44] Neufeld,J.、György,A.、Schurmans,D.和Szepesvári,C.(2014)。通过强盗分配自适应蒙特卡洛。arXiv预打印arXiv:1405.3318。
[45] Owen,A.和Zhou,Y.(2000年)。安全有效的重要性抽样。美国统计协会杂志,95,135-143·Zbl 0998.65003号
[46] Owen,A.B.(2013)。蒙特卡罗理论、方法和示例。https://artowen.su.domains/mc/
[47] Owen,A.B.、Maximov,Y.和Chertkov,M.(2019)。重要性抽样——罕见事件的结合及其在电力系统分析中的应用。电子统计杂志,13,231-254·Zbl 1416.62088号
[48] Rainforth,T.、Zhou,Y.、Lu,X.、Teh,Y.W.、Wood,F.、Yang,H.和van deMeent,J.‐W。(2018). 推理树:带探索的自适应推理。arXiv预印arXiv:1806.09550。
[49] Rainforth,T.、Golinski,A.、Wood,F.和Zaidi,S.(2020)。目标软件贝叶斯推断:如何击败最佳的传统蒙特卡罗估计。机器学习研究杂志,21,1-54·Zbl 1504.62036号
[50] 罗伯特·C·P、卡塞拉·G和卡塞拉·G(1999)。蒙特卡罗统计方法(第2卷)。斯普林格·Zbl 0935.62005号
[51] Srinivas,N.、Krause,A.、Kakade,S.M.和Seeger,M.(2009年)。土匪背景下的高斯过程优化:无遗憾和实验设计。arXiv预打印arXiv:0912.3995。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。