×

改进了不可逆马尔可夫链中松弛时间的估计。 (英语) Zbl 07829142号

摘要:我们证明了在常乘性误差下估计遍历马氏链的伪谱间隙({\gamma}_{\mathsf{ps}})的最小最大样本复杂度为\[\widetilde{\Theta}\bigg(\frac{1}{{\gamma}{\mathsf{ps}}{\pi}_\star}\big),\]其中,({\pi}_\star)是最小平稳概率,恢复可逆设置中的已知界限,以估计绝对光谱间隙(Hsu等人。,附录申请。普罗巴伯。\(\mathbf{29})(2019)2439-2480),以及解决Wolfer和Kontorovich的公开问题(In第三十二届学习理论会议记录(2019年)3120-3159 PMLR)。此外,我们通过使已知的经验过程完全适应数据、细化置信区间和降低计算复杂性来加强它。在此基础上,我们导出了伪谱间隙的新性质,并引入了随机矩阵可逆膨胀的概念。

MSC公司:

60J10型 马尔可夫链(离散状态空间上的离散时间马尔可夫过程)
2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
62M99型 随机过程推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ALMAN,J.和WILLIAMS,V.V.(2021)。改进的激光方法和更快的矩阵乘法。在2021 ACM-SIAM离散算法研讨会论文集上(SODA公司) 522-539. 宾夕法尼亚州费城SIAM。数字对象标识符:10.1137/1.9781611976465.32谷歌学者:查找链接数学科学网:MR4262465·doi:10.1137/1.9781611976465.32
[2] ARORA,S.、HAZAN,E.和KALE,S.(2005年)。使用乘法权重更新方法的近似半定规划快速算法。在第46届IEEE计算机科学基础年会上,FOCS 2005 339-348。IEEE,洛斯阿拉米托斯。
[3] BIERKENS,J.(2016)。不可逆大都市——黑斯廷斯。统计计算。26 1213-1228. 数字对象标识符:10.1007/s11222-015-9598-x谷歌学者:查找链接数学科学网:MR3538633·Zbl 1360.65040号 ·doi:10.1007/s11222-015-9598-x
[4] BILLINGSLEY,P.(1961年)。马尔可夫链中的统计方法。安。数学。统计数字32 12-40。数字对象标识符:10.1214/aoms/1177705136谷歌学者:查找链接MathSciNet:MR0123420·Zbl 0104.12802号 ·doi:10.1214/aoms/1177705136
[5] Bradley,R.C.(2005)。强混合条件的基本特性。调查和一些开放性问题。普罗巴伯。Surv公司。2 107-144. 数字对象标识符:10.1214/15495780510000104谷歌学者:查找链接数学科学网:MR2178042·兹比尔1189.60077 ·doi:10.1214/154957805100000104
[6] CHEN,F.、LOVáSZ,L.和PAK,I.(1999)。提升马尔可夫链以加速混合。美国计算机学会计算理论年度研讨会(佐治亚州亚特兰大,1999)275-281。纽约ACM。数字对象标识符:10.1145/301250.301315谷歌学者:查找链接数学科学网:MR1798046·Zbl 1345.60075号 ·doi:10.1145/301250.301315
[7] CHEN,T.-L.和HWANG,C.-R.(2013)。加速可逆马尔可夫链。统计师。普罗巴伯。莱特。83 1956-1962. 数字对象标识符:10.1016/j.spl.2013.05.002谷歌学者:查找链接数学科学网:MR3079029·兹比尔1285.60076 ·doi:10.1016/j.spl.2013.05.002
[8] CHOI,M.C.H.(2020年)。不可逆马尔可夫链的Metropolis-Hastings可逆化。随机过程。申请。130 1041-1073. 数字对象标识符:10.1016/j.spa.2019.04.006谷歌学者:查找链接数学科学网:MR4046529·Zbl 1436.60070号 ·doi:10.1016/j.spa.2019.04.006
[9] COHEN,D.、KONTOROVICH,A.和WOLFER,G.(2020年)。学习具有无限支持的离散分布。神经信息处理系统进展33 3942-3951。
[10] COMBES,R.和TOUATI,M.(2019年)。马尔可夫链谱间隙的计算效率估计。程序。ACM测量。分析。计算。系统。3 1-21.
[11] Diaconis,P.、Holmes,S.和Neal,R.M.(2000)。不可逆马尔可夫链采样器的分析。附录申请。普罗巴伯。10 726-752. 数字对象标识符:10.1214/aoap/1019487508谷歌学者:查找链接数学科学网:MR1789978·Zbl 1083.60516号 ·doi:10.1214/aoap/1019487508
[12] FILL,J.A.(1991)。不可逆马尔可夫链的特征值界收敛到平稳性,并应用于排除过程。附录申请。普罗巴伯。1 62-87. 数学科学网:MR1097464·Zbl 0726.60069号
[13] GARNIER,R.(2021)。机器学习在电子商务领域的应用。CY Cergy巴黎大学博士论文。
[14] GARNIER,R.、LANGHENDRIES,R.和RYNKIEWICZ,J.(2023)。马尔可夫过程预测模型的Hold-out估计。统计57 458-481. 数字对象标识符:10.1080/02331888.2023.2183203谷歌学者:查找链接数学科学网:MR4580789·Zbl 07687635号 ·doi:10.1080/02331888.2023.2183203
[15] HERSCHLAG,G.、MATTINGLY,J.C.、SACHS,M.和WYSE,E.(2020年)。用于分布图采样的不可逆马尔可夫链蒙特卡罗。arXiv预印本。可从arXiv:2008.07843获取。
[16] 希尔德布兰德,M.(1997)。不可逆马尔可夫链采样器的收敛速度。预打印。
[17] HSU,D.、KONTOROVICH,A.、LEVIN,D.A.、PERES,Y.、SZEPESVáRI,C.和WOLFER,G.(2019年)。基于单样本路径的可逆马尔可夫链混合时间估计。附录申请。普罗巴伯。29 2439-2480. 数字对象标识符:10.1214/18-AAP1457谷歌学者:查找链接数学科学网:MR3983341·Zbl 1466.60143号 ·doi:10.1214/18-AAP1457
[18] HSU,D.J.、KONTOROVICH,A.和SZEPESVARI,C.(2015)。基于单样本路径的可逆马尔可夫链混合时间估计。神经信息处理系统进展28。
[19] KANIEL,S.(1966年)。线性代数中一些计算技术的估计。数学。公司。20 369-378. 数字对象标识符:10.2307/2003590谷歌学者:查找链接数学科学网:MR0234618·Zbl 0156.16202号 ·doi:10.2307/2003590
[20] KOTSALIS,G.(2022年)。不确定性下优化的可追踪近似和算法方面。乔治亚理工学院博士论文。
[21] KUCZYŃSKI,J.和WOŹNIAKOWSKI,H.(1992)。采用随机启动的幂算法和Lanczos算法估计最大特征值。SIAM J.矩阵分析。申请。13 1094-1122. 数字对象标识符:10.1137/0613066谷歌学者:查找链接数学科学网:MR1182715·Zbl 0759.65016号 ·数字对象标识代码:10.1137/0613066
[22] LEVIN,D.A.和PERES,Y.(2016年)。从短轨迹估计可逆马尔可夫链的谱间隙。arXiv预印本。可在arXiv:1612.05330上获得。
[23] LEVIN,D.A.、PERES,Y.和WILMER,E.L.(2009)。马尔可夫链和混合时间。AMS,Providence,RI.数字对象标识符:10.1090/mbk/058谷歌学者:查找链接数学科学网:MR2466937·Zbl 1160.60001号 ·doi:10.1090/mbk/058
[24] LI,T.、LAN,G.和PANANJADY,A.(2023)。线性函数近似下的加速和实例最优策略评估。SIAM J.数学。数据科学。5 174-200. 数字对象标识符:10.1137/21M1468668谷歌学者:查找链接数学科学网:MR4562584·Zbl 07669892号 ·doi:10.137/21M1468668
[25] MCDONALD,D.、SHALIZI,C.和SCHERVISH,M.(2011)。估算β-混合系数。第十四届国际人工智能与统计会议论文集516-524。
[26] MOHRI,M.和ROSTAMIZADEH,A.(2007年)。非iid过程的稳定性边界。高级神经信息处理。系统。20
[27] MONTENEGRO,R.和TETALI,P.(2006)。马尔可夫链中混合时间的数学方面。已找到。趋势理论。计算。科学。1 237-354. 数字对象标识符:10.1561/0400000003谷歌学者:查找链接数学科学网:MR2341319·Zbl 1193.68138号 ·doi:10.1561/0400000003
[28] NEAL,R.M.(2004)。改进MCMC估计量的渐近方差:不可逆链更好。多伦多大学统计系第0406号技术报告。
[29] ORTNER,R.(2020年)。基于马尔可夫链集中的强化学习的遗憾界。《人工智能研究杂志》67 115-128。数学科学网:MR4066312·Zbl 1442.68198号
[30] PAIGE,C.C.(1971)。计算超大稀疏矩阵的特征值和特征向量。伦敦大学博士论文。
[31] PAULIN,D.(2015)。马尔顿耦合和谱方法的马尔可夫链的集中不等式。电子。J.遗嘱认证。20 1-32。数字对象标识符:10.1214/EJP.v20-4039谷歌学者:查找链接数学科学网:MR3383563·Zbl 1342.60121号 ·doi:10.1214/EJP.v20-4039
[32] Paulsen,V.(2002)。完全有界映射和算子代数。剑桥高等数学研究78。剑桥大学出版社,剑桥。数学科学网:MR1976867·Zbl 1029.47003号
[33] POWER,S.和GOLDMAN,J.V.(2019年)。具有不可逆马尔可夫过程的离散空间上的加速采样。arXiv预印本。可在arXiv:1912.04681上获得。
[34] SAAD,Y.(1980)。关于Lanczos和block-Lanczos方法的收敛速度。SIAM J.数字。分析。17 687-706. 数字对象标识符:10.1137/0717059谷歌学者:查找链接数学科学网:MR0588755·Zbl 0456.65016号 ·doi:10.1137/0717059
[35] SHALIZI,C.R.和KONTOROVICH,A.(2013)。预测性PAC学习和过程分解。高级神经信息处理。系统。26
[36] STEINWART,I.、HUSH,D.和SCOVEL,C.(2009年)。从依赖性观察中学习。《多元分析杂志》。100 175-194. 数字对象标识符:10.1016/j.jmva.2008.04.001谷歌学者:查找链接数学科学网:MR2460486·Zbl 1158.68040号 ·doi:10.1016/j.jmva.2008.04.001
[37] Stewart,G.W.和Sun,J.G.(1990年)。矩阵摄动理论。计算机科学和科学计算。马萨诸塞州波士顿学术出版社。数学科学网:MR1061154·Zbl 0706.65013号
[38] SUN,Y.、SCHMIDHUBER,J.和GOMEZ,F.J.(2010年)。通过插入涡改进马尔可夫链Monte-Carlo的渐近性能。神经信息处理系统进展2235-2243。
[39] SUWA,H.和TODO,S.(2010年)。无详细平衡的马尔可夫链蒙特卡罗方法。物理学。修订版Lett。105 120603. 数字对象标识符:10.1103/PhysRevLett.10120603谷歌学者:查找链接·doi:10.10103/物理通讯.105.120603
[40] SYED,S.、BOUCHARD-CÔTé,A.、DELIGIANNIDIS,G.和DOUCET,A.(2022)。不可逆并行回火:一种可扩展的高度并行MCMC方案。J.R.统计社会服务。B.统计方法。84 321-350. 数学科学网:MR4412989·Zbl 07593414号
[41] TROPP,J.(2015)。矩阵集中不等式简介。已找到。趋势马赫数。学习。8 1-230. ·Zbl 1391.15071号
[42] Tropp,J.A.(2012年)。随机矩阵和的用户友好尾部界限。已找到。计算。数学。12 389-434. 数字对象标识符:10.1007/s10208-011-9099-z谷歌学者:查找链接数学科学网:MR2946459·Zbl 1259.60008号 ·doi:10.1007/s10208-011-9099-z
[43] TROUNG,L.V.(2022a)。Markov数据集深度学习的泛化误差界。高级神经信息处理。系统。35 23452-23462.
[44] TRUONG,L.V.(2022b)。混合数据集多核学习的泛化界。arXiv预印本。可从arXiv:2205.07313获得。
[45] Turitsyn,K.S.、Chertkov,M.和Vucelja,M.(2011年)。高效采样的不可逆蒙特卡罗算法。物理学。D、 非线性现象。240 410-414. ·Zbl 1216.82022号
[46] VUCELJA,M.(2016)。提升——一种不可逆的马尔可夫链蒙特卡罗算法。美国物理学杂志。84 958-968.
[47] WOLFER,G.(2020年)。使用收缩方法从单个轨迹在遍历马尔可夫链中混合时间估计。算法学习理论。程序。机器。学习。研究(PMLR公司) 117 890-905. 加利福尼亚州圣地亚哥市PMLR数学科学网:MR4165417
[48] WOLFER,G.(2022)。马尔可夫链和混合时间的经验和实例相关估计。arXiv预印本。可从arXiv:1912.06845获得。
[49] WOLFER,G.和KONTOROVICH,A.(2019年)。估计遍历马尔可夫链的混合时间。第三十二届学习理论会议论文集。机器学习研究论文集99 3120-3159。美国凤凰城PMLR。
[50] WOLFER,G.和KONTOROVICH,A.(2021)。离散状态空间上遍历马尔可夫链核的统计估计。伯努利27 532-553. 数字对象标识符:10.3150/20-BEJ1248谷歌学者:查找链接MathSciNet:MR44177379·Zbl 1472.62133号 ·doi:10.3150/20-BEJ1248
[51] WOLFER,G.和WATANABE,S.(2021年)。可逆马尔可夫链的信息几何。地理信息。4 393-433. 数字对象标识符:10.1007/s41884-021-00061-7谷歌学者:查找链接数学科学网:MR4345345·Zbl 1479.60153号 ·doi:10.1007/s41884-021-00061-7
[52] YU,B.(1994)。平稳混合序列经验过程的收敛速度。Ann.遗嘱认证。22 94-116. 数学科学网:MR1258867·Zbl 0802.60024号
[53] ZWEIG,A.和BRUNA,J.(2020年)。通过离线观察,第三人称模仿效果显著。在人工智能不确定性会议1228-1237。PMLR公司。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。