×

聚类的贝叶斯推理和多个高斯图形模型的选择。 (英语) Zbl 07553096号

摘要:我们考虑了一个贝叶斯框架,用于对高维数据进行聚类并同时学习稀疏的多个图形模型。与以往大多数假设聚类信息事先已知的多图学习方法不同,我们对聚类标签施加了多分布先验。然后,对精度矩阵施加一个联合的尖峰-拉索先验图形,可以自适应地在所有簇中诱导异构图形模型的稀疏性和均匀性。此外,通过引入结构马尔可夫随机场(MRF)先验,该方法还可以在不假设样本独立性的情况下对网络关联数据进行聚类。然后利用快速期望最大化(EM)算法进行后验推理。该模型可以显著提高聚类误差和图形选择精度。仿真和实际数据分析表明了该方法的性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bai,R.、Moran,G.E.、Antonelli,J.L.、Chen,Y.和Boland,M.R.(2020年)。分组回归和稀疏广义可加模型的钉板组套索。《美国统计协会杂志》,第1-41页。
[2] O.班纳吉。;LE Ghaoui;d'Aspremont,A.,多元高斯或二进制数据的稀疏最大似然估计模型选择,机器学习研究杂志,9,3,485-516(2008)·Zbl 1225.68149号
[3] Bishop,CM,模式识别和机器学习(2006),springer·Zbl 1107.68072号
[4] 布莱,DM;Kucukelbir,A。;McAuliffe,JD,《变量推断:统计学家评论》,《美国统计协会杂志》,第112、518、859-877页(2017年)·doi:10.1080/01621459.2017.1285773
[5] 布伦南,CW;维哈克,RG;McKenna,A。;坎波斯,B。;努什梅尔,H。;萨拉马,SR;郑S。;查克拉瓦蒂,D。;桑伯恩,JZ;Berman,SH,胶质母细胞瘤的体细胞基因组景观,Cell,155,2,462-477(2013)·doi:10.1016/j.cell.2013.09.034
[6] Briollais,L.公司。;多布拉,A。;刘杰。;弗里德兰德,M。;Ozcelik,H。;Massam,H.,全基因组关联研究(gwas)的贝叶斯图形模型,应用统计学年鉴,10,2786-811(2016)·Zbl 1400.62251号 ·doi:10.1214/16-AOAS909
[7] Danaher,P.、Wang,P.和Witten,D.M.(2014)。用于多类协方差逆估计的联合图形套索。英国皇家统计学会杂志。B系列统计方法论,76(2):373·Zbl 07555455号
[8] 多布拉,A。;艾彻,TS;Lenkoski,A.,使用高斯图形模型对宏观经济增长决定因素中的不确定性进行建模,《统计方法》,7,3,292-306(2010)·doi:10.1016/j.stamet.2009.11.003
[9] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,33432-441(2008)·兹比尔1143.62076 ·doi:10.1093/biostatistics/kxm045
[10] 甘·L。;Narisetty,NN;Liang,F.,不等收缩图形模型的贝叶斯正则化,美国统计协会杂志,114,527,1218-1231(2019)·Zbl 1428.62225号 ·doi:10.1080/01621459.2018.1482755
[11] 高,C。;Zhu,Y。;沈,X。;Pan,W.,《高斯混合模型中多重网络的估计》,《电子统计杂志》,101133(2016)·Zbl 1335.62098号
[12] Hao,B.、Sun,W.W.、Liu,Y.和Cheng,G.(2018)。异构图形模型的同时聚类和估计。机器学习研究杂志·Zbl 1473.62220号
[13] Y.Hong。;Kim,C.,《高维协方差估计及其相关问题的最新进展》,《韩国统计学会杂志》,47,239-247(2018)·Zbl 1395.62124号 ·doi:10.1016/j.jkss.2018.04.005
[14] 吉,P。;Jin,J.,统计学家合著与引用网络,《应用统计年鉴》,10,4,1779-1812(2016)·Zbl 1454.62541号
[15] Leskovec,J。;Rajaraman,A。;Ullman,J.,《海量数据集挖掘》(2014),剑桥大学出版社·doi:10.1017/CBO9781139924801
[16] Li,F。;Zhang,NR,结构化高维协变量空间中的贝叶斯变量选择及其在基因组学中的应用,美国统计协会杂志,105,491,1202-1214(2010)·Zbl 1390.62027号 ·doi:10.1198/jasa.2010.tm08177
[17] 李·T。;钱,C。;莱维纳,E。;Zhu,J.,网络关联数据的高维高斯图形模型,机器学习研究杂志,21,74,1-45(2020)·Zbl 1498.68249号
[18] 李,ZR;Mccormick,T.,高斯图形模型的期望条件最大化方法,计算与图形统计杂志,28,4,767-777(2019)·Zbl 07499025号 ·doi:10.1080/10618600.2019.1609976
[19] 李,ZR;麦考密克,T。;Clark,S.,Bayesian联合钉板图形套索,第36届机器学习国际会议论文集,97,3877-3885(2019)
[20] 穆罕默德,A。;Abegaz,F。;van den Heuvel,E。;Wit,EC,使用高斯copula图形模型对dupuytren病进行贝叶斯建模,英国皇家统计学会杂志,66,3,629-645(2017)
[21] 潘·W。;Shen,X.,基于惩罚模型的聚类及其在变量选择中的应用,《机器学习研究杂志》,8,41,1145-1164(2007)·Zbl 1222.68279号
[22] 彭杰。;王,P。;周,N。;Zhu,J.,联合稀疏回归模型的偏相关估计,美国统计协会杂志,104,486,735-746(2009)·Zbl 1388.62046号 ·doi:10.1198/jasa.2009.0126
[23] 彼得森,C。;Stingo,FC;Vannucci,M.,多重高斯图形模型的贝叶斯推断,美国统计协会杂志,110,509,159-174(2015)·Zbl 1373.62106号 ·doi:10.1080/01621459.2014.896806
[24] 罗奇科娃,V。;George,EI,Emvs:贝叶斯变量选择的em方法,美国统计协会杂志,109,506,828-846(2014)·Zbl 1367.62049号 ·doi:10.1080/01621459.2013.869223
[25] 罗奇科娃,V。;George,EI,《钉子和实验室套索》,《美国统计协会杂志》,113,521,431-444(2018)·Zbl 1398.62186号 ·doi:10.1080/01621459.2016.1260469
[26] Sun,W。;Wang,J。;Fang,Y.,高维数据的正则k-means聚类及其渐近一致性,《电子统计杂志》,6,148-167(2012)·Zbl 1335.62109号 ·doi:10.1214/12-EJS668
[27] 维哈克,RG;霍德利,KA;Purdom,E。;王,V。;齐,Y。;Wilkerson,医学博士;密勒,CR;丁·L。;Golub,T。;Mesirov,JP,综合基因组分析确定以pdgfra、idh1、egfr和nf1异常为特征的胶质母细胞瘤临床相关亚型,癌细胞,17,1,98-110(2010)·doi:10.1016/j.ccr.2009.12.020
[28] 温赖特,MJ;Jordan,MI,《图形模型、指数族和变分推理》(2008),Now Publishers Inc·Zbl 1193.62107号
[29] Wang,H.,扩大规模:图形模型中的随机搜索结构学习,贝叶斯分析,10,2,351-377(2015)·Zbl 1335.62068号 ·doi:10.1214/14-BA916
[30] Wang,J.,通过交叉验证对聚类数量的一致选择,Biometrika,97,4893-904(2010)·Zbl 1204.62104号 ·doi:10.1093/biomet/asq061
[31] 王,S。;Zhu,J.,基于模型的高维聚类变量选择及其在微阵列数据中的应用,生物统计学,64,2,440-448(2008)·Zbl 1137.62041号 ·文件编号:10.1111/j.1541-0420.2007.00922.x
[32] 谢,B。;潘·W。;Shen,X.,通过分组参数的正则化进行基于惩罚模型的聚类中的变量选择,生物计量学,64,3921-930(2008)·Zbl 1146.62101号 ·doi:10.1111/j.1541-0420.2007.00955.x
[33] 袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,Biometrika,94,1,19-35(2007)·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018
[34] 周,H。;潘·W。;Shen,X.,基于惩罚模型的无约束协方差矩阵聚类,电子统计杂志,31473(2009)·Zbl 1326.62143号 ·doi:10.1214/09-EJS487
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。