×

稀疏高斯图形模型中的贝叶斯结构学习。 (英语) 兹比尔1335.62056

摘要:解码大量变量之间的复杂关系,而观测值相对较少,是科学中的关键问题之一。解决此问题的一种方法是高斯图形建模,它通过基础图中是否存在边来描述变量的条件独立性。本文介绍了一种新的、有效的用于高斯图形模型确定的贝叶斯框架,该框架是基于连续时间出生-死亡过程的跨维马尔可夫链蒙特卡罗(MCMC)方法。我们介绍了该方法的理论和计算细节。它易于实现,并且在计算上对高维图是可行的。我们证明了我们的方法在收敛性、图空间混合和计算时间方面优于其他贝叶斯方法。与频率学习法不同,它为结构学习提供了一种原则性的、实际可行的方法。我们在广泛的模拟数据上说明了该方法的有效性。然后,我们将该方法应用于人类和乳腺基因表达研究的大规模实际应用中,以显示其经验性有用性。此外,我们在R包BDgraph中实现了该方法,该包在http://CRAN.R-project.org/package=BDgraph.

MSC公司:

2015年1月62日 贝叶斯推断
60J28型 连续时间Markov过程在离散状态空间中的应用
62甲12 多元分析中的估计
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
62A09号 统计学中的图形方法
65立方厘米60 统计中的计算问题(MSC2010)
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abegaz,F.和Wit,E.(2013年)。重建遗传网络的稀疏时间序列链图形模型〉,《生物统计学》,14(3):586-599。
[2] Albert,R.和Barabási,A.-L.(2002年)。《复杂网络的统计力学》,《现代物理学评论》,74(1):47·Zbl 1205.82086号 ·doi:10.1103/RevModPhys.74.47
[3] Atay-Kayis,A.和Massam,H.(2005年)。“计算不可分解高斯图形模型中边际似然的蒙特卡罗方法”,《生物特征识别》,92(2):317-335·Zbl 1094.62028号 ·doi:10.1093/biomet/92.2.317
[4] Baldi,P.、Brunak,S.、Chauvin,Y.、Andersen,C.A.和Nielsen,H.(2000)。“评估分类预测算法的准确性:概述”,《生物信息学》,16(5):412-424。
[5] Bhadra,A.和Mallick,B.K.(2013年)。“联合高维贝叶斯变量和协方差选择及其在eQTL分析中的应用”,《生物计量学》,69(2):447-457·Zbl 1274.62722号 ·doi:10.1111/biom.12021
[6] Cappé,O.、Robert,C.和Rydén,T.(2003)。“可逆跳跃、出生和死亡以及更普遍的连续时间马尔可夫链蒙特卡罗采样器”,《皇家统计学会杂志:B辑(统计方法)》,65(3):679-700·Zbl 1063.62133号 ·doi:10.1111/1467-9868.00409
[7] Carvalho,C.M.和Scott,J.G.(2009年)。“高斯图形模型中的目标贝叶斯模型选择”,《生物特征识别》,96(3):497-512·1170.62020兹罗提 ·doi:10.1093/biomet/asp017
[8] Chen,L.、Tong,T.和Zhao,H.(2008)。“考虑eQTL定位中错误发现控制的基因和标记之间的依赖性”,《生物信息学》,24(18):2015-2022。
[9] Cheng,Y.,Lenkoski,A.等人(2012)。“层次高斯图形模型:超越可逆跳跃”,《电子统计杂志》,6:2309-2331·Zbl 1335.62042号 ·doi:10.1214/12-EJS746
[10] Dahlhaus,R.和Eichler,M.(2003)。《时间序列分析中的因果关系和图形模型》,牛津统计科学系列,115-137。
[11] Dempster,A.(1972年)。《协方差选择》,生物计量学,28(1):157-175。
[12] Dobra,A.、Lenkoski,A.和Rodriguez,A.(2011年A)。“一般高斯图形模型的贝叶斯推断及其在多元格点数据中的应用”,《美国统计协会杂志》,106(496):1418-1433·Zbl 1234.62018年 ·doi:10.1198/jasa.2011.tm10465
[13] Dobra,A.、Lenkoski,A.等人(2011年b)。“Copula Gaussian图形模型及其在功能性残疾数据建模中的应用”,《应用统计学年鉴》,5(2A):969-993·Zbl 1232.62046号 ·doi:10.1214/10-AOAS397
[14] Foygel,R.和Drton,M.(2010年)。“高斯图形模型的扩展贝叶斯信息标准”,收录于Lafferty,J.、Williams,C.K.I.、Shawe-Taylor,J.,Zemel,R.和Culotta,A.(编辑),《神经信息处理系统进展》23,604-612。
[15] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)。“用图形套索进行稀疏逆协方差估计”,《生物统计学》,9(3):432-441·兹比尔1143.62076 ·doi:10.1093/biostatistics/kxm045
[16] Geyer,C.J.和Möller,J.(1994)。“空间点过程的模拟程序和似然推理”,斯堪的纳维亚统计杂志,359-373·Zbl 0809.62089号
[17] Giudici,P.和Castelo,R.(2003年)。“改进数据挖掘的马尔可夫链蒙特卡罗模型搜索”,《机器学习》,50(1-2):127-158·Zbl 1050.68120号 ·doi:10.1023/A:10202028934
[18] Giudici,P.和Green,P.(1999)。“可分解图形高斯模型测定”,《生物特征》,86(4):785-801·Zbl 0940.62019号 ·doi:10.1093/biomet/86.4.785
[19] Green,P.(1995)。“可逆跳跃马尔可夫链蒙特卡罗计算和贝叶斯模型确定”,《生物特征识别》,82(4):711-732·Zbl 0861.62023号 ·doi:10.1093/biomet/82.4.711
[20] Green,P.J.(2003)。《超维马尔可夫链蒙特卡罗》,牛津统计科学系列,179-198年。
[21] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。统计学习的要素:数据挖掘、推理和预测,第2卷。斯普林格·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[22] Jones,B.、Carvalho,C.、Dobra,A.、Hans,C.、Carter,C.和West,M.(2005年)。“高维图形模型的随机计算实验”,《统计科学》,20(4):388-400·Zbl 1130.62408号 ·doi:10.1214/088342305000000304
[23] Kullback,S.和Leibler,R.A.(1951年)。“关于信息和充分性”,《数理统计年鉴》,22(1):79-86·Zbl 0042.38403号 ·doi:10.1214/aoms/1177729694
[24] Labrie,F.、Luu-The,V.、Lin,S.-X.、Claude,L.、Simard,J.、Breton,R.和Bélanger,A.(1997)。“17(β)-羟基类固醇脱氢酶在性类固醇生物学中的关键作用”,类固醇,62(1):148-158。
[25] Lauritzen,S.(1996)。图形模型,第17卷。美国牛津大学出版社·Zbl 0907.62001
[26] Lenkoski,A.(2013)。“G-Wishart变量的直接采样器。”Stat,2(1):119-128。
[27] Lenkoski,A.和Dobra,A.(2011)。“与G-Wishart先验高斯图形模型中推理相关的计算方面”,《计算与图形统计杂志》,20(1):140-157·doi:10.1198/jcgs.2010.08181
[28] Letac,G.和Massam,H.(2007年)。“可分解图的Wishart分布”,《统计年鉴》,35(3):1278-1323·Zbl 1194.62078号 ·doi:10.1214/009053600000.1235
[29] Liang,F.(2010)。“具有难以处理的归一化常数的空间模型的双Metropolis-Hastings采样器”,《统计计算与模拟杂志》,80(9):1007-1022·Zbl 1233.62117号 ·doi:10.1080/00949650902882162
[30] Liu,H.、Roeder,K.和Wasserman,L.(2010年)。“高维图形模型正则化选择的稳定性方法(StARS)”,《神经信息处理系统进展》,1432-1440。
[31] Meinshausen,N.和Bühlmann,P.(2006)。“高维图和用套索选择变量”,《统计年鉴》,34(3):1436-1462·兹比尔1113.62082 ·doi:10.1214/0090536000000281
[32] Mohammadi,A.和Wit,E.C.(2013年)。BDgraph:基于出生死亡MCMC的图形估计。R包版本2.10。
[33] Muirhead,R.(1982)。多元统计理论方面,第42卷。威利在线图书馆·兹伯利0556.62028
[34] Murray,I.、Ghahramani,Z.和MacKay,D.(2012)。“双顽固分布的MCMC。”arXiv
[35] Pitt,M.、Chan,D.和Kohn,R.(2006年)。“高斯copula回归模型的有效贝叶斯推断”,《生物特征》,93(3):537-554·Zbl 1108.62027号 ·doi:10.1093/biomet/93.3537
[36] Powers,D.M.(2011)。“评估:从精确性、召回率和F-measure到ROC、信息性、标记性和相关性”,《机器学习技术杂志》,2(1):37-63。
[37] Preston,C.J.(1976年)。“特殊的出生和死亡过程”,《国际统计研究所公报》,46:371-391。
[38] Ravikumar,P.、Wainwright,M.J.、Lafferty,J.D.等人(2010年)。“使用L1-正则逻辑回归进行高维伊辛模型选择”,《统计年鉴》,38(3):1287-1319·Zbl 1189.62115号 ·doi:10.1214/09-AOS691
[39] Ripley,B.D.(1977年)。《空间模式建模》,《皇家统计学会杂志》。B系列(方法学),172-212·Zbl 0369.60061号
[40] Roverato,A.(2002年)。“非可分解图的超逆Wishart分布及其在高斯图形模型贝叶斯推断中的应用”,《斯堪的纳维亚统计杂志》,29(3):391-411·Zbl 1036.62027号 ·doi:10.1111/1467-9469.00297
[41] Schmidt-Ott,K.M.、Mori,K.、Li,J.Y.、Kalandadze,A.、Cohen,D.J.、Devarajan,P.和Barasch,J.(2007年)。“中性粒细胞明胶酶相关脂肪卡林的双重作用”,《美国肾脏病学会杂志》,18(2):407-413。
[42] Scott,J.G.和Berger,J.O.(2006年)。“贝叶斯多重测试方面的探索”,《统计规划与推断杂志》,136(7):2144-2162·Zbl 1087.62039号 ·doi:10.1016/j.jspi.2005.08.031
[43] Scutari,M.(2013)。“关于图形建模中使用的先验和后验分布”,贝叶斯分析,8(1):1-28·兹比尔1329.62145 ·doi:10.1214/13-BA819
[44] Stein,T.、Morris,J.S.、Davies,C.R.、Weber-Hall,S.J.、Duffy,M.-A.、Heath,V.J.、Bell,A.K.、Ferrier,R.K.、Sandilands,G.P.和Gusterson,B.A.(2004)。“小鼠乳腺的退化与免疫级联和急性期反应有关,涉及LBP、CD14和STAT3。”《乳腺癌研究》,6(2):R75-91。
[45] Stephens,M.(2000年)。“成分数量未知的混合模型的贝叶斯分析——可逆跳跃方法的替代方法”,《统计学年鉴》,28(1):40-74·Zbl 1106.62316号 ·doi:10.1214/aos/1016120364
[46] Stranger,B.E.,Nica,A.C.,Forrest,M.S.,Dimas,A.,Bird,C.P.,Beazley,C.,Ingle,C.E.,Dunning,M.,Flicek,P.,Koller,D.等人(2007年)。人类基因表达的群体基因组学〉,《自然遗传学》,39(10):1217-1224。
[47] Wang,H.(2012)。“贝叶斯图形套索模型和有效的后验计算”,《贝叶斯分析》,7(4):867-886·Zbl 1330.62041号 ·doi:10.1214/12-BA729
[48] - (2014). “放大:图形模型中的随机搜索结构学习。”
[49] Wang,H.和Li,S.(2012)。“G-Wishart先验分布下的有效高斯图形模型确定”,《电子统计杂志》,6:168-198·Zbl 1335.62069号 ·doi:10.1214/12-EJS669
[50] Wang,H.和Pillai,N.S.(2013年)。“关于协方差矩阵估计的一类收缩先验”,《计算与图形统计杂志》,22(3):689-707·doi:10.1080/10618600.2013.785732
[51] Wit,E.和McClure,J.(2004)。微阵列统计:设计、分析和推断。约翰·威利父子公司·Zbl 1049.62120号 ·doi:10.1002/0470011084
[52] Zhao,P.和Yu,B.(2006)。“关于拉索的模型选择一致性”,《机器学习研究杂志》,7:2541-2563·Zbl 1222.62008年
[53] Zhao,T.、Liu,H.、Roeder,K.、Lafferty,J.和Wasserman,L.(2012)。“R中高维无向图估计的巨大包”,《机器学习研究杂志》,13(1):1059-1062·Zbl 1283.68311号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。