×

具有鲁棒先验信息的新颖性检测的两阶段贝叶斯半参数模型。 (英语) Zbl 1475.62027号

统计计算。 31,第4号,第42号论文,第19页(2021年); 更正同上,第32号,第1号,第18号论文,第1页(2022年)。
摘要:新颖的检测方法旨在将测试单元划分为已观察到的和以前未观察到的模式。然而,出现了两个重要的问题:人们可能对确定新颖性中的特定结构有相当大的兴趣,而已知类别中的污染可能会完全模糊显式组和新组之间的实际分离。基于这些问题,我们提出了一种两阶段贝叶斯半参数新颖性检测器,该检测器基于从一组完整的学习单元中稳健提取的先验信息。我们设计了一种通用的多元方法,并将其扩展到处理函数数据对象。我们通过研究相关半参数先验的理论性质,对模型行为提供了见解。从计算的角度来看,我们提出了一个合适的(黑体符号{xi})序列来构造一个独立的切片高效采样器,该采样器考虑了显式组件和新颖组件之间的差异。我们通过对多元和函数数据集的广泛模拟研究和应用展示了我们的模型性能,在这些数据集中发现了各种不同的未知模式。

MSC公司:

62-08 统计问题的计算方法
62G05型 非参数估计
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 亚伯拉罕,C。;宾夕法尼亚州Cornillon;Matzner-Löber,E。;Molinari,N.,使用B样条的无监督曲线聚类,Scand。《统计杂志》,30,3,581-595(2003)·兹比尔1039.91067 ·doi:10.1111/1467-9469.00350
[2] 巴拉蒂,Z。;扎克里,I。;Pourrezaei,K.,功能近红外光谱数据的功能数据分析视图,J.Biomed。选择。,18, 11, 117007 (2013) ·文件编号:10.1117/1.JBO.18.11.117007
[3] 毕格罗,JL;Dunson,DB,功能预测因子的贝叶斯半参数联合模型,美国统计协会,104,485,26-36(2009)·Zbl 1388.62181号 ·doi:10.198/jasa.2009.0001
[4] Binder,DA,贝叶斯聚类分析,Biometrika,65,1,31(1978)·Zbl 0376.62007号 ·doi:10.1093/biomet/65.1.31
[5] 布莱,DM;Kucukelbir,A。;McAuliffe,JD,《变量推断:统计学家评论》,《美国统计协会期刊》,第112、518、859-877页(2017年)·doi:10.1080/01621459.2017.1285773
[6] Boudt,K。;罗素,PJ;Vanduffel,S。;Verdonck,T.,最小正则协方差行列式估计,统计计算。,30, 1, 113-128 (2020) ·Zbl 1436.62197号 ·数字对象标识代码:10.1007/s11222-019-09869-x
[7] Bouveyron,C.,《监督学习中未观察类的自适应混合判别分析》,J.Classif。,31, 1, 49-84 (2014) ·Zbl 1360.62315号 ·数字对象标识代码:10.1007/s00357-014-9147-x
[8] 巴特勒,RW;戴维斯,PL;Jhun,M.,最小协方差行列式估计的渐近性,Ann.Stat.,21,3,1385-1400(1993)·Zbl 0797.62044号 ·doi:10.1214/aos/1176349264
[9] Canale,A。;A·李高。;尼波蒂,B。;Prünster,I.,《关于使用钉板基础测量的Pitman-Yor过程》,Biometrika,104,3,681-697(2017)·Zbl 07072235号 ·doi:10.1093/biomet/asx041
[10] 卡波佐,A。;格雷塞林,F。;Murphy,TB,《稳健半监督学习的异常和新颖性检测》,Stat.Compute。,30, 5, 1545-1571 (2020) ·Zbl 1461.62015年 ·doi:10.1007/s11222-020-09959-1
[11] Carpenter,G.A.,Rubin,M.A.,Streilein,W.W.:ARTMAP-FD:应用于雷达目标识别的熟悉度判别。摘自:《神经网络国际会议论文集》(ICNN'97),第3卷,第1459-1464页。IEEE(1997)
[12] Cator,电针;Lopuhaä,HP,一般多元分布下MCD估计量的中心极限定理和影响函数,Bernoulli,18,2,520-551(2012)·Zbl 1239.62068号 ·doi:10.3150/11-BEJ353
[13] Charytanowicz,M。;Niewczas,J。;Kulczycki,P。;宾夕法尼亚州科瓦尔斯基;Ł乌克兰,S。;Zak,S.,《X射线图像特征分析的完全梯度聚类算法》,《高级智能》。软计算。,69, 15-24 (2010) ·doi:10.1007/978-3-642-13105-9_2
[14] 克罗克斯,C。;Haesbroeck,G.,最小协方差行列式散布矩阵估计器的影响函数和效率,J.Multivar。分析。,71, 2, 161-190 (1999) ·Zbl 0946.62055号 ·doi:10.1006/jmva.1999.1839
[15] De Blasi,P.,Martínez,A.F.,Mena,R.H.,Prünster,I.:关于混合模型中减重结构的推断含义。输入:计算。统计数据分析。第147卷(2020年)·Zbl 1510.62031号
[16] de Boor,C.:花键实用指南,修订版。(2001) ·Zbl 0987.65015号
[17] Dempster,A。;莱尔德,N。;Rubin,D.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.,39,1,1-38(1977)·Zbl 0364.62022号
[18] 医学博士埃斯科瓦尔;West,M.,《使用混合物的贝叶斯密度估计和推断》,美国统计协会,90,430,577-588(1995)·Zbl 0826.62021号 ·doi:10.1080/01621459.1995.10476550
[19] Ferguson,TS,一些非参数问题的贝叶斯分析,Ann.Stat.,1,2,209-230(1973)·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[20] 司法部长费尔南德斯·皮尔纳;Dardenne,P.,“Chimiométrie 2005”化学计量学竞赛:一项鉴别研究,Chemmeter。智力。实验室系统。,86, 2, 219-223 (2007) ·doi:10.1016/j.chemolab.2006.06.009
[21] Fop,M.,Mattei,P.-A.,Bouveyron,C.,Murphy,T.B.:高维判别分析中未观察到的类别和额外变量。arXiv预打印arXiv:2102.01982(2021)
[22] Gordaliza,A.,基于修剪程序的随机变量最佳近似,J.近似理论,64,2,162-180(1991)·Zbl 0745.41030号 ·doi:10.1016/0021-9045(91)90072-I
[23] 古铁雷斯。;古铁雷斯-佩尼亚,E。;Mena,RH,光谱数据的贝叶斯非参数分类,计算。统计数据分析。,78, 56-68 (2014) ·Zbl 1506.62073号 ·doi:10.1016/j.csda.2014.04.010
[24] 休伯特,M。;Debruyne,M.,最小协方差行列式,威利跨学科。版本:计算。《统计》,第2、1、36-43页(2010年)·doi:10.1002/wics.61
[25] 休伯特,M。;Debruyne,M。;Rousseeuw,PJ,最小协方差行列式和扩展,威利跨学科。版本:计算。统计,10,3,1-11(2018)
[26] 休伯特,M。;Van Driessen,K.,快速和稳健判别分析,Computat。统计数据分析。,45, 2, 301-320 (2004) ·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2
[27] Ishwaran,H。;James,LF,Gibbs《破胶前期取样方法》,《美国统计协会期刊》,96,453,161-173(2001)·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[28] 卡利,M。;JE格里芬;Walker,SG,切片取样混合模型,统计计算。,21, 1, 93-105 (2011) ·Zbl 1256.65006号 ·doi:10.1007/s11222-009-9150-y
[29] 汗,党卫军;Madden,MG,《一级分类:研究分类和技术回顾》,Knowl。工程版次,29,3,345-374(2014)·网址:10.1017/S026988891300043X
[30] 刘,JW;Green,PJ,基于贝叶斯模型的聚类程序,J.Compute。图表。Stat.,16,3,526-558(2007)·doi:10.1198/106186007X238855
[31] Lo,AY,关于一类贝叶斯非参数估计:I,密度估计。Ann.Stat.,12,1,351-357(1984)·兹伯利0557.62036
[32] Malsiner-Walli,G。;Frühwirth-Schnatter,S。;Grün,B.,基于稀疏有限高斯混合的基于模型的聚类,统计计算。,26, 1-2, 303-324 (2016) ·Zbl 1342.62109号 ·doi:10.1007/s11222-014-9500-2
[33] Manikopoulos,C。;Papavassiliou,S.,《网络入侵和故障检测:统计异常方法》,IEEE Commun。马加。,40, 10, 76-82 (2002) ·doi:10.1109/MCOM.2002.1039860
[34] 玛丽娜,RA;Yohai,VJ,多元分散和位置的稳健有效估计,计算。统计数据分析。,109, 64-75 (2017) ·Zbl 1466.62158号 ·doi:10.1016/j.csda.2016.11.006
[35] McElhinney,J。;唐尼,G。;Fearn,T.,《选定生肉匀浆中物种鉴定用可见和近红外反射光谱的化学计量处理》,J.近红外光谱学。,7, 3, 145-154 (1999) ·doi:10.1255/jnirs.245
[36] Meiló,M.,《比较聚类——基于信息的距离》,J.Multivar。分析。,98, 5, 873-895 (2007) ·Zbl 1298.91124号 ·doi:10.1016/j.jmva.2006.11.013
[37] Miller,D.,Browning,J.:用于鲁棒分类、异常值拒绝和类发现的混合模型和EM算法。2003年IEEE声学、语音和信号处理国际会议,2003年。诉讼程序。(ICASSP’03),第2卷。11,第II-809-12页。IEEE(2003)
[38] 墨菲,TB;N.院长。;Raftery,AE,《食品真实性应用中高维数据基于模型的判别分析中的变量选择和更新》,Ann.Appl。统计,4,1,396-421(2010)·Zbl 1189.62105号 ·doi:10.1214/09-AOAS279
[39] Petrone,S.公司。;Guindani,M。;Gelfand,AE,功能数据的混合Dirichlet混合模型,J.R.Stat.Soc.Ser。B: 统计方法。,71, 4, 755-782 (2009) ·Zbl 1248.62079号 ·文件编号:10.1111/j.1467-9868.2009.00708.x
[40] Pitman,J.,可交换和部分可交换随机分区,Probab。理论关联。菲尔德,102,2,145-158(1995)·Zbl 0821.60047号 ·doi:10.1007/BF01213386
[41] 皮特曼,J。;Yor,M.,从稳定从属子导出的双参数Poisson-Dirichlet分布,Ann.Probab。,25, 2, 855-900 (1997) ·兹标0880.60076 ·doi:10.1214/aop/1024404422
[42] Ramsay,J。;Silverman,BW,功能数据分析,Springer Series in Statistics(2005),纽约:Springer,纽约·Zbl 1079.62006号 ·doi:10.1007/b98888
[43] Rand,WM,《聚类方法评估的客观标准》,美国统计协会期刊,66,336,846(1971)·doi:10.1080/01621459.1971.10482356
[44] Rasmussen,C.E.,Williams,C.K.I.:机器学习的高斯过程(自适应计算和机器学习)。麻省理工学院出版社(2005)
[45] Rigon,T.:功能聚类的丰富混合模型(2019)
[46] Ritter,G.:稳健聚类分析和变量选择。查普曼和霍尔/CRC(2014)·兹比尔1341.62037
[47] Rodriguez,A.,Dunson,D.B.:嵌套设计中的功能聚类:生殖流行病学研究中的建模变异性。附录申请。《统计》第8(3)卷,第1416-1442页(2014年)·Zbl 1303.62040号
[48] 卢梭,J。;Mengersen,K.,过量混合模型中后验分布的渐近行为,J.R.Stat.Soc.,Ser。B: 统计方法。,73, 5, 89-710 (2011) ·Zbl 1228.62034号 ·doi:10.1111/j.1467-9868.2011.00781.x
[49] Rousseeuw,PJ,最小二乘回归,美国统计协会,79,388,871-880(1984)·Zbl 0547.62046号 ·doi:10.1080/01621459.1984.10477105
[50] 罗素,PJ;Driessen,KV,最小协方差行列式估计的快速算法,《技术计量学》,41,3,212-223(1999)·doi:10.1080/00401706.1999.10485670
[51] 斯卡帕,B。;Dunson,DB,通过污染信息先验进行贝叶斯层次功能数据分析,生物统计学,65,3,772-780(2009)·Zbl 1172.62059号 ·doi:10.1111/j.1541-0420.2008.01163.x
[52] Sethuraman,J.,《Dirichlet过程优先的建设性定义》,Stat.Sin。,4, 2, 639-650 (1994) ·兹比尔0823.62007
[53] Singh,M.,Domijan,K.:食品认证研究中机器学习模型的比较。2019年第30届爱尔兰信号与系统会议(ISSC),第1-6页。IEEE(2019)
[54] Strumiło,A.、Niewczas,J.、Szczypiñski,P.、Makowski,P.和Woźniak,W.:小麦x射线图像分析的计算机系统(初步公告)国际农业物理学(1999)。(1999)
[55] Tarassenko,L.,Hayton,P.,Cerneaz,N.,Brady,M.:乳房X光片中肿块识别的新颖检测,IET(1995)
[56] Tax,D.M.,Duin,R.P.:使用分类器不稳定性进行异常检测。摘自:IAPR模式识别(SPR)和结构与句法模式识别(SSPR)统计技术联合国际研讨会,第593-601页。斯普林格(1998)
[57] 托多罗夫,V。;Filzmoser,P.,稳健多元分析的面向对象框架,J.Stat.Softw。,32, 3, 1-47 (2009) ·doi:10.18637/jss.v032.i03
[58] 韦德,S。;Ghahramani,Z.,《贝叶斯聚类分析:点估计和可信球(讨论)》,贝叶斯分析。,13, 2, 559-626 (2018) ·Zbl 1407.62241号 ·doi:10.1214/17-BA1073
[59] 杨,M。;邓森,DB;Baird,D.,带均值和方差约束的半参数贝叶斯层次模型,计算。统计数据分析。,54, 9, 2172-2186 (2010) ·Zbl 1284.62187号 ·doi:10.1016/j.csda.2010.03.025
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。