×

贝叶斯核两样本测试。 (英语) Zbl 07633311号

摘要:在现代数据分析中,随机变量之间差异的非参数度量尤其重要。该主题在频率学家的文献中得到了很好的研究,而在贝叶斯环境中的发展受到了限制,因为应用通常局限于单变量情况。在这里,我们提出了一种贝叶斯核双样本测试程序,该程序基于使用以下所建立的框架对再生核Hilbert空间中的核均值嵌入之间的差异进行建模S.弗拉克斯曼等[“内核嵌入的贝叶斯学习”,载于:第三十二届人工智能不确定性会议论文集,UAI'16。弗吉尼亚州阿灵顿:AUAI出版社。182–191 (2016;doi:10.5555/3020948.3020968)]. 核方法的使用使其能够应用于多元欧氏空间以外的泛型域中的随机变量。提出的过程产生了一个后验推理方案,该方案允许自动选择与当前问题相关的核参数。在一系列合成实验和两个实际数据实验中(即从高维数据测试网络异质性和六元单环构象比较),我们说明了我们的方法的优势。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Berlinet,A。;Thomas-Agnan,C.,《概率统计中的再生核Hilbert空间》(2004),Dordrecht:Kluwer,Dordracht·Zbl 1145.6202号
[2] 伯纳多,J.M。;Smith,A.F.M.,贝叶斯理论(2000),奇切斯特:威利·Zbl 0943.62009号
[3] 博格沃德,K.M。;Z.Ghahramani,《贝叶斯二样本测试》,ArXiv电子版:0906.4032(2009)
[4] 博格沃德,K.M。;格雷顿,A。;Rasch,M.J。;Kriegel,H.P。;Schölkopf,B。;Smola,A.J.,“通过核最大平均差异整合结构化生物数据,生物信息学,22,49-57(2006)·doi:10.1093/bioinformatics/btl242
[5] 卡彭特,B。;盖尔曼,A。;医学博士霍夫曼。;Lee,D。;古德里奇,B。;贝当古,M。;布鲁贝克,M。;郭杰。;李,P。;Riddell,A.,“Stan:概率编程语言,统计软件杂志,76,1-32(2017)·doi:10.18637/jss.v076.i01
[6] 陈,Y。;Hanson,T.E.,“删失和未删失数据的贝叶斯非参数k样本检验,计算统计与数据分析,71,335-346(2014)·Zbl 1471.62041号
[7] 克里默,D。;Pople,J.A.,“环状折叠坐标的一般定义”,《美国化学学会杂志》,971354-1358(1975)·doi:10.1021/ja00839a011
[8] DeGroot,M.H.,《做自然发生的事:将尾部区域解释为后验概率或似然比》,《美国统计协会杂志》,68966-969(1973)·Zbl 0271.62049号 ·doi:10.1080/01621459.1973.10481456
[9] 菲利普,S。;Holmes,C.C.,“测试随机变量之间相关性的贝叶斯非参数方法,贝叶斯分析(2016)·Zbl 1384.62146号 ·doi:10.1214/16-BA1027
[10] 菲利普,S。;C.C.福尔摩斯。;Nieto-Barajas,L.E.,“通过Dirichlet过程混合探索成对依赖性的可扩展贝叶斯非参数测度,电子统计杂志,10,3338-3354(2016)·Zbl 1358.62058号 ·数字对象标识代码:10.1214/16-ejs1171
[11] 弗拉克斯曼,S。;Sejdinovic,D。;坎宁安,J.P。;Filippi,S.,《内核嵌入的贝叶斯学习,人工智能中的不确定性》(UAI,182-191(2016)
[12] Fukumizu,K。;格雷顿,A。;Sun,X.H。;Schölkopf,B.,条件依赖的核心度量(2008)
[13] 格雷顿,A。;Borgwardt,K。;Rasch,M.J。;Schölkopf,B。;Smola,A.,“内核双样本测试”,《机器学习研究杂志》(JMLR,13,723-773(2012)·Zbl 1283.62095号
[14] 格雷顿,A。;Sriperumbudur,B。;Sejdinovic,D。;斯特拉赫曼,H。;Balakrishman,S。;庞蒂尔,M。;Fukumizu,K.,《大尺度双样本测试的最佳内核选择》(2012)
[15] 医学博士霍夫曼。;Gelman,A.,“无转弯采样器:在哈密顿蒙特卡罗中自适应设置路径长度”,《机器学习研究杂志》,151593-1623(2014)·Zbl 1319.60150号
[16] C.C.福尔摩斯。;卡隆,F。;格里芬,J.E。;Stephens,D.A.,“双样本贝叶斯非参数假设检验,贝叶斯分析,10297-320(2015)·Zbl 1334.62082号 ·doi:10.1214/14-BA914
[17] Jefferys,W.H。;Berger,J.O.,“Ockham的剃刀和贝叶斯分析”,《美国科学杂志》,80,64-72(1992)
[18] Jeffreys,H.,“概率论处理的意义测试”,《剑桥哲学学会学报》,第31期,第203-222页(1935年)·文件编号:10.1017/S030500410001330X
[19] 杰弗里斯,H.,《概率论》(1961),牛津:牛津大学出版社,牛津·Zbl 0116.34904号
[20] Kamary,K。;Mengersen,K。;罗伯特·C·P。;Rousseau,J.,通过混合估计模型检验假设,ArXiv电子版:1412.2044(2014)
[21] Kass,R.E。;Raftery,A.E.,“贝叶斯因素,美国统计协会杂志,90,773-795(1995)·Zbl 0846.62028号 ·doi:10.1080/01621459.1995.10476572
[22] Lukić,M.N。;Beder,J.H.,“再生核Hilbert空间中具有样本路径的随机过程,美国数学学会学报,353,3945-3969(2001)·Zbl 0973.60036号 ·doi:10.1090/S0002-9947-01-02852-5
[23] 麦凯,D.J.C.,《信息理论、推理和学习算法》(2003),剑桥:剑桥大学出版社,剑桥·Zbl 1055.94001号
[24] 肖-泰勒,J。;Cristianini,N.,《模式分析的核心方法》,第19页,共22页(2004年),剑桥:剑桥大学出版社,剑桥
[25] Smola,A。;格雷顿,A。;宋,L。;Schölkopf,B.,《分布的希尔伯特空间嵌入》,13-31(2007)·Zbl 1142.68407号
[26] Sriperumbudur,B.K.,《再生核空间嵌入和概率度量指标》(2010年)
[27] 北卡罗来纳州施特勒。;Mukherjee,S.,“高维双样本测试”,《皇家统计学会统计方法期刊》,B辑,79,225-246(2017)·Zbl 1414.62199号 ·doi:10.1111/rssb.12173
[28] 北卡罗来纳州施特勒。;Mukherjee,S.,《从高维数据研究网络异质性的生物导体包》(2019年)
[29] 炖牛肉,O。;Denby,K.J。;库克·E·J。;Wild,D.L。;加赫拉马尼,Z。;Borgwardt,K.M.,“检测微阵列时间序列中差异基因表达间隔的稳健贝叶斯双样本检验,计算生物学杂志,17,355-367(2010)·doi:10.1089/cmb.2009.0175
[30] 斯坦瓦特,I。;Christmann,A.,支持向量机(2008),纽约:Springer,纽约·Zbl 1203.68171号
[31] Wahba,G.,观测数据的样条模型(1990),宾夕法尼亚州费城:工业和应用数学学会,宾夕法尼亚州,费城·兹伯利0813.62001
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。