×

在线测试随机性。 (英语) Zbl 07473938号

摘要:随机性假设是统计机器学习和非参数统计许多领域的基础;它表示,假设观测值是独立的,并且来自相同的未知概率分布。在某些方面,这个假设与交换性假设很接近,交换性假设假设观测值的分布与其排列无关。本文回顾了测试这两个假设的已知方法,重点是当观察结果按顺序到达时的在线测试模式。所有已知的在线测试这些假设的方法都是基于保形鞅的,并对保形鞅进行了详细的定义和研究。在线测试的一个重要种类是变化检测,其中保角鞅的使用导致CUSUM和Shiryaev-Roberts过程的保角版本;这些版本在非参数设置中工作,其中数据根据更改前完全未知的分布假定为IID。本文强调了概念和实践方面,并陈述了两种结果。有效性结果限制了错误报警的概率,或者在变化检测的情况下,基于共形鞅的各种程序的错误报警频率。效率结果在随机性、可交换性和共形鞅之间建立了联系。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Balasubramanian,V.N.,Ho,S.-S.和Vovk,V.编辑(2014)。可靠机器学习的保角预测:理论、适应和应用阿姆斯特丹爱思唯尔·Zbl 1290.68003号
[2] Bartels,R.(1982)。冯·诺依曼随机性比率检验的秩版本。J.Amer。统计师。协会。77 40-46. ·Zbl 0482.62032号
[3] 伯努利·J(1713)。阿尔斯·康普坦迪巴塞尔图尔尼修斯。
[4] Bhattacharya,P.K.(1994)。变化点分析的某些方面。变更点问题(马萨诸塞州South Hadley, 1992).数理统计研究所讲稿——专题丛书23 28-56. 加利福尼亚州海沃德IMS·Zbl 1157.62331号 ·doi:10.1214/lnms/1215463112
[5] Caeiro,F.和Mateus,A.(2014)。几个随机性测试的R实现。AIP确认程序。1618 531-534.
[6] 古诺,A.-A.(1843)。机会与概率博览会巴黎哈切特·Zbl 0174.51702号
[7] Cover,T.M.和Thomas,J.A.(2006年)。信息论要素第二版,新泽西州霍博肯市威利跨科学出版社·Zbl 1140.94001号
[8] Doob,J.L.(1953年)。随机过程纽约威利·Zbl 0053.26802号
[9] Du,W.、Polunchenko,A.S.和Sokolov,G.(2017年)。关于Shiryaev-Roberts变点检测程序在变后分布参数错误指定下的鲁棒性。通信统计。仿真计算。46 2185-2206. ·Zbl 1364.62214号 ·doi:10.1080/03610918.2015.1039131
[10] Dua,D.和Graff,C.UCI机器学习库(2020年)。数据集由Andrea Martiniano、Ricardo Pinto Ferreira和Renato Jose Sassi捐赠。
[11] Fedorova,V.、Nouretdinov,I.、Gammerman,A.和Vovk,V.(2012)。在线测试互换性的插件鞅。第二十九届国际机器学习会议记录(J.Langford和J.Pineau编辑)1639-1646年。赫尔辛基Omnipress。
[12] Grünwald,P.、de Heide,R.和Koolen,W.M.(2020)。安全测试。技术报告。可从arXiv:1906.07801[math.ST]获取。
[13] Herbster,M.和Warmuth,M.K.(1998年)。追踪最佳专家。机器。学习。32 151-178. ·兹比尔0912.68165
[14] Ho,S.-S.和Wechsler,H.(2010)。通过测试可交换性来检测数据流变化的鞅框架。IEEE传输。模式分析。机器。智力。32 2113-2127.
[15] Jeffreys,H.(1961年)。概率论第三版,牛津克拉伦登出版社·Zbl 0116.34904号
[16] Kelly,J.L.Jr.(1956年)。信息速率的一种新解释。贝尔系统。技术J。35 917-926. ·doi:10.1002/j.1538-7305.1956.tb03809.x
[17] Keysers,D.M.(2000)。不变图像目标识别方法。硕士论文,Lehrstuhl für Informatik VI,Mathematisch-Naturwissenschaftliche Fakultät,Rheinisch-Westfälische Technische Hochschule Aachen,德国亚琛。
[18] 科尔莫戈洛夫(1933)。Wahrscheinlichkeitsrechnung公司柏林施普林格。英文翻译:概率论基础切尔西,纽约,1950年。
[19] Kolmogorov,A.N.(1963年)。在随机数表上。SankhyáSer。25 369-376. ·Zbl 0126.33203号
[20] Kolmogorov,A.N.(1965年)。信息定量定义的三种方法。问题。信息传输。1 1-7. ·Zbl 0271.94018号
[21] Kolmogorov,A.N.(1968年)。信息论和概率论的逻辑基础。IEEE传输。Inf.理论IT-14 662-664·Zbl 0167.47601号 ·doi:10.1109/tit.1968.1054210
[22] Kolmogorov,A.N.(1983年)。信息论和概率演算的组合基础。俄罗斯数学。调查38 29-40. ·兹比尔0597.60002
[23] Kolmogorov,A.N.和Shiryaev,A.N..(1960年)。Применение марковских прощессов к обнаружению разлащок произвощственного прощесса. 维尔纽斯,ДоккаинаVIСореаанииПотеоариаероетностиесТеематаТимекеиттсамткира。
[24] Lehmann,E.L.(1975)。非参数:基于等级的统计方法Holden-Day,Inc.,加利福尼亚州旧金山·Zbl 0354.62038号
[25] Lehmann,E.L.和Romano,J.P.(2005年)。测试统计假设,第3版。统计学中的施普林格文本纽约州施普林格·兹比尔1076.62018
[26] Martin-Löf,P.(1966年)。随机序列的定义。Inf.控制9 602-619. ·Zbl 0244.62008号
[27] McDonald,D.(1990年)。基于序列秩的cusum过程。海军后勤研究。37 627-646. ·Zbl 0722.62064号
[28] 佩奇·E.S.(1954)。连续检查计划。生物特征41 100-115. ·Zbl 0056.38002号 ·doi:10.1093/biomet/41.1-2.100
[29] Pollak,M.(1987)。检测分布变化的最佳方法的平均运行长度。安。统计师。15 749-779. ·Zbl 0632.62080号 ·doi:10.1214/aos/1176350373
[30] Poor,H.V.和Hadjiliadis,O.(2009年)。最快检测剑桥大学出版社,剑桥·Zbl 1271.62015年
[31] Popper,K.R.(1982)。开放的宇宙伦敦哈钦森。
[32] Robbins,H.(1955)。关于斯特林公式的评论。阿默尔。数学。每月62 26-29. ·兹比尔0068.05404 ·doi:10.2307/2308012
[33] Roberts,S.W.(1966年)。一些控制图程序的比较。技术计量学8 411-430. ·doi:10.2307/1266688
[34] Schervish,M.J.(1995)。统计学理论.统计学中的斯普林格系列纽约州施普林格·兹伯利0834.62002 ·doi:10.1007/978-1-4612-4250-5
[35] Shafer,G.(2019年)。博彩语言作为统计和科学交流的一种策略(有讨论)。J.R.统计社会服务。。显示。可在arXiv:1903.06991[math.ST]上获取。
[36] Shafer,G.和Vovk,V.(2006年)。科尔莫戈罗夫的来源格兰贝格里夫.统计师。科学。21 70-98. ·Zbl 1426.01011号 ·doi:10.1214/088342305000000467
[37] Shafer,G.和Vovk,V.(2019年)。概率与金融的博弈论基础新泽西州霍博肯威利·Zbl 1422.91026号
[38] Shewhart,W.A.(1931年)。制造产品质量的经济控制Van Nostrand,纽约。
[39] Shiryaev,A.N.(1963年)。最快检测问题中的最佳方法。理论问题。申请。8 22-46. ·Zbl 0213.43804号
[40] Shiryaev,A.N.(2010年)。最快的检测问题:五十年后。序贯分析。29 345-385. ·Zbl 1203.62137号 ·doi:10.1080/07474946.2010.520580
[41] Shiryaev,A.N.(2019年)。概率-第2、3版。数学研究生课程95.纽约斯普林格·Zbl 1472.60001号
[42] Shiryaev,A.N.(2019年)。随机障碍问题.概率论与随机建模93.商会施普林格·Zbl 1426.93002号 ·doi:10.1007/978-3-030-01526-8
[43] Siegmund,D.、Yakir,B.和Zhang,N.R.(2011年)。检测对齐序列中的同时变化间隔。附录申请。斯达。5 645-668. ·Zbl 1223.62166号 ·doi:10.1214/10-AOAS400
[44] Simard,P.、LeCun,Y.和Denker,J.(1993)。使用新的变换距离进行高效的模式识别。高级神经信息处理。系统。5 50-58.
[45] van Erven,T.、Grünwald,P.、de Rooij,S.和Jandhyala,V.K.(2012)。更早切换以更快赶上:自适应估计的预测方法,并应用于AIC-BIC困境(与讨论)。J.R.统计社会服务。B类74 361-417. ·Zbl 1411.62073号 ·文件编号:10.1111/j.1467-9868.2011.01025.x
[46] Ville,J.(1939年)。《收藏概念评论》巴黎Gauthier-Villars·Zbl 0021.14505号
[47] Volkhonskiy,D.、Burnaev,E.、Nouretdinov,I.、Gammerman,A.和Vovk,V.(2017)。用于变点检测的归纳共形鞅。程序。机器。学习。物件。60 132-153. 2017年COPA。
[48] 冯·米塞斯(1919)。Grundlagen der Wahrscheinlichkeitsrechnung公司。数学。Z.公司。5 52-99. ·doi:10.1007/BF01203155
[49] Vovk,V.(1986年)。关于伯努利性质的概念。俄罗斯数学。调查41 247-248. 俄文原件:。另一个有证明的英文译本:arXiv:1612.08859[math.ST],2016年12月·Zbl 0624.60022号
[50] Vovk,V.(2021)。补充“在线测试随机性”https://doi.org/10.1214/20-STS817SUPP网站
[51] Vovk,V.、Gammerman,A.和Shafer,G.(2005)。随机世界中的算法学习纽约州施普林格·兹比尔1105.68052
[52] Vovk,V.和Wang,R.(2020年)。通过平均值组合\(p\)-值。生物特征107 791-808. ·Zbl 1457.62078号 ·doi:10.1093/biomet/asaa027
[53] Vovk,V.和Wang,R.(2020年)。E值:校准、组合和应用。安。统计师。出现。可从arXiv:1912.06116[math.ST]获取·Zbl 1475.62087号
[54] Vovk,V.G.和V'yugin,V.V.(1993)。贝叶斯方法的实证有效性。J.罗伊。统计师。Soc.序列号。B类55 253-266. ·Zbl 0788.62006号
[55] Wald,A.(1945年)。统计假设的顺序检验。安。数学。斯达。16 117-186. ·Zbl 0060.30207号 ·doi:10.1214/aoms/1177731118
[56] Wald,A.(1947)。顺序分析纽约威利·Zbl 0029.15805号
[57] Wald,A.和Wolfowitz,J.(1943年)。基于序列相关性的非参数情况下随机性的精确测试。安。数学。斯达。14 378-388. ·Zbl 0060.30206号 ·doi:10.1214/aoms/1177731358
[58] Wald,A.和Wolfowitz,J.(1948年)。序贯概率比检验的最优性质。安。数学。斯达。19 326-339. ·Zbl 0032.17302号 ·doi:10.1214/aoms/1177730197
[59] Zhang,X.、Lu,P.、Martens,J.、Ericson,G.和Sharkey,K.(2020年)。Microsoft Azure中的时间序列异常检测模块微软,西雅图,华盛顿州。在线文档
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。