×

使用贝叶斯潜在高斯图形模型推断口头尸检中的症状关联。 (英语) Zbl 1459.62096号

摘要:混合类型变量之间的学习依赖关系提供了在各种科学背景下的见解,是统计学中研究得很好的问题。然而,现有的方法通常依赖大量高质量的数据来准确地学习关联。在本文中,我们开发了一种用于科学环境的方法,在这种环境中,学习依赖结构是必不可少的,但数据很稀疏,并且有很高比例的缺失值。具体来说,我们的工作受到了基于调查的死因评估(即口头尸检)的推动。我们提出了一种贝叶斯方法来描述依赖关系,该方法使用潜在高斯图形模型,该模型结合了变量边际分布的信息先验。我们证明了这些信息可以改进依赖结构的估计,特别是在训练数据很少的情况下。我们表明,我们的方法可以集成到现有的概率死因分配算法中,并在恢复症状之间的依赖模式的同时提高模型性能,从而为未来数据收集中的有效问卷设计提供信息。

MSC公司:

62H22个 概率图形模型
62H30型 分类和区分;聚类分析(统计方面)
62号05 可靠性和寿命测试
62页第10页 统计学在生物学和医学科学中的应用;元分析
92D25型 人口动态(一般)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrews,J.L.和McNicholas,P.D.(2014)。“聚类和分类的变量选择”,《分类杂志》,31(2):136-153·Zbl 1360.62310号 ·doi:10.1007/s00357-013-9139-2
[2] Barnard,J.、McCulloch,R.和Meng,X.-L.(2000)。“根据标准偏差和相关性建模协方差矩阵,并应用于收缩”,《统计》,10(4):1281-1311·Zbl 0980.62045号
[3] Bhadra,A.、Rao,A.和Baladadayuthapani,V.(2018年)。“推断非正常和混合离散连续基因组数据中的网络结构。”生物计量学,74(1):185-195·Zbl 1415.62085号 ·doi:10.1111/biom.12711
[4] Bu,Y.和Lederer,J.(2017)。《将额外知识整合到图形模型估算中》,arXiv预印本arXiv:1704.02739。
[5] Byass,P.、Huong,D.L.和Van Minh,H.(2003年)。“解释口头尸检的概率方法:越南的方法和初步验证”,《斯堪的纳维亚公共卫生杂志》,31(62增刊):32-37。
[6] Clark,S.J.、Li,Z.R.和McCormick,T.H.(2018年)。“量化训练数据和算法逻辑对口头尸检自动原因分配算法性能的贡献”,arXiv预印本arXiv:1803.07141。
[7] Crampin,A.C.、Dube,A.、Mboma,S.、Price,A.、Chihana,M.、Jahn,A.、Baschieri,A.、Molesworth,A.、Mpaiyeghele,E.、Branson,K.等人(2012年)。“简介:卡隆加健康和人口监测系统”,《国际流行病学杂志》,41(3):676-685。
[8] Deshpande,S.K.、Rockova,V.和George,E.I.(2017年)。《用多元尖峰和平顶拉索同时选择变量和协方差》,arXiv预印本arXiv:1708.08911。
[9] Dobra,A.、Lenkoski,A.等人(2011年)。“Copula Gaussian图形模型及其在功能性残疾数据建模中的应用”,《应用统计学年鉴》,5(2A):969-993·Zbl 1232.62046号 ·doi:10.1214/10-AOAS397
[10] Fan,J.、Liu,H.、Ning,Y.和邹,H.(2016)。《混合数据的高维半参数潜在图形模型》,《皇家统计学会期刊:B辑(统计方法)》·Zbl 1414.62179号 ·doi:10.1111/rssb.12168
[11] Gan,L.、Narisetty,N.N.和Liang,F.(2018年)。“不等收缩图形模型的贝叶斯正则化”,《美国统计协会杂志》,1-14·Zbl 1428.62225号 ·doi:10.1080/01621459.2018.1482755
[12] Gelman,A.(2006年)。“层次模型中方差参数的先验分布(Browne和Draper的文章评论)。”贝叶斯分析,1(3):515-534·Zbl 1331.62139号 ·doi:10.1214/06-BA117A
[13] Gruhl,J.、Erosheva,E.A.和Crane,P.K.(2013)。“混合结果潜在变量模型的半参数方法:估计认知与区域脑容量之间的关联”,《应用统计年鉴》,2361-2383·Zbl 1283.62218号 ·doi:10.1214/13-AOAS675
[14] Hoff,P.D.(2007)。“扩展半参数copula估计的秩似然”,《应用统计年鉴》,265-283·邮编1129.62050 ·doi:10.1214/07-AOAS107
[15] Horton,R.(2007)。《健康计数》,《柳叶刀》,370(9598):1526。
[16] James,S.L.、Flaxman,A.D.、Murray,C.J.和Consortium Population Health Metrics Research(2011年)。“关税方法的性能:口头尸检分析简单加法算法的验证”,《人口健康指标》,9(31)。
[17] Jha,P.(2014)。《低收入和中等收入国家死因的可靠直接测量》,BMC医学,12(1):19。
[18] Jin,Z.和Matteson,D.S.(2018年)。“通过基于能量和基于核的相互依赖度量进行独立成分分析”,arXiv预印本arXiv:1805.06639。
[19] Jones,B.、Carvalho,C.、Dobra,A.、Hans,C.、Carter,C.和West,M.(2005年)。“高维图形模型的随机计算实验”,《统计科学》,388-400·兹比尔1130.62408 ·doi:10.1214/088342305000000304
[20] King,G.和Lu,Y.(2008)。“多死因的口头尸检方法”,《统计科学》,100(469)·Zbl 1327.62506号 ·doi:10.1214/07-STS247
[21] Klaassen,C.A.和Wellner,J.A.(1997)。“二元正态copula模型中的有效估计:正态边际最不利。”Bernoulli,3(1):55-77·Zbl 0877.62055号 ·doi:10.2307/3318652
[22] Kunihama,T.、Li,Z.R.、Clark,S.J.和McCormick,T.H.(2018年)。“用口头尸检进行死亡原因概率评估的贝叶斯因子模型”,arXiv预印本arXiv:1803.01327·Zbl 1439.62220号 ·doi:10.1214/19-AOAS1253
[23] Lenkoski,A.和Dobra,A.(2011)。“与G-Wishart先验高斯图形模型中推理相关的计算方面”,《计算与图形统计杂志》,20(1):140-157·doi:10.1198/jcgs.2010.08181
[24] Li,Y.、Craig,B.A.和Bhadra,A.(2017)。“逆协方差矩阵的图形马蹄估计”,arXiv预印本arXiv:1707.06661。
[25] Li,Z.和McCormick,T.H.(2019年)。“高斯图形模型的期望条件最大化方法”,《计算与图形统计杂志》,1-11。
[26] Li,Z.R.、McCormick,T.和Clark,S.(2019a)。openVA:自动口头尸检方法。R软件包版本1.0.8。统一资源定位地址http://CRAN.R-project.org/package=openVA。
[27] Li,Z.R.、McCormick,T.和Clark,S.(2019b)。补充材料“使用贝叶斯潜在高斯图形模型推断口头尸检中的症状关联”贝叶斯分析。
[28] Liu,H.、Han,F.、Yuan,M.、Lafferty,J.、Wasserman,L.等(2012)。“高维半参数高斯copula图形模型”,《统计年鉴》,40(4):2293-2326·兹比尔1297.62073 ·doi:10.1214/12-AOS1037
[29] Liu,H.、Lafferty,J.和Wasserman,L.(2009)。“非paranormal:高维无向图的半参数估计”,《机器学习研究杂志》,10(10月):2295-2328·Zbl 1235.62035号
[30] Liu,J.S.和Wu,Y.N.(1999年)。“数据增强的参数扩展”,《美国统计协会杂志》,94(448):1264-1274·Zbl 1069.62514号 ·doi:10.1080/01621459.1999.10473879
[31] McCormick,T.H.、Li,Z.R.、Calvert,C.、Crampin,A.C.、Kahn,K.和Clark,S.J.(2016)。“使用口头尸检确定死亡原因的概率”,《美国统计协会期刊》,111(515):1036-1049。
[32] Meng,X.-L.和Van Dyk,D.A.(1999)。“通过条件和边缘增强寻求有效的数据增强方案。”Biometrika,86(2):301-320·兹比尔1054.62505 ·doi:10.1093/biomet/86.2.301
[33] Miasnikof,P.、Giannakeas,V.、Gomes,M.、Aleksandrowicz,L.、Shestopaloff,A.Y.、Alam,D.、Tollman,S.、Samarikhalaj,A.和Jha,P.(2015)。“言语尸检的朴素贝叶斯分类法:21000例儿童和成人死亡与基于物理学家的分类法的比较”,BMC医学,13(1):1。
[34] Mohammadi,A.、Abegaz,F.、van den Heuvel,E.和Wit,E.C.(2017年)。“使用高斯连接图图形模型对Dupuytren病进行贝叶斯建模”,《皇家统计学会杂志:C辑(应用统计学)》,66(3):629-645。
[35] Mohammadi,R.和Wit,E.C.(2017年)。“BDgraph:图形模型中贝叶斯结构学习的R包。”arXiv预印本arXiv:1501.05108。
[36] Murray,C.J.、Lopez,A.D.、Black,R.、Ahuja,R.,Ali,S.M.、Baqui,A.、Dandona,L.、Dantzer,E.、Das,V.、Dhingra,U.等人(2011年A)。“人口健康指标研究联盟金标准口头尸检验证研究:分析数据集的设计、实施和开发”,《人口健康指标》,9(1):27。
[37] Murray,C.J.、Lozano,R.、Flaxman,A.D.、Vahdatpour,A.和Lopez,A.D.(2011年b)。“在验证研究中评估不同口头尸检原因分配方法性能的稳健指标。”,9(1):28。
[38] Murray,I.、Adams,R.和MacKay,D.(2010年)。“椭圆切片取样”,《第十三届国际人工智能与统计会议论文集》,541-548。
[39] Murray,J.S.、Dunson,D.B.、Carin,L.和Lucas,J.E.(2013)。“混合数据的贝叶斯-高斯copula因子模型”,《美国统计协会杂志》,108(502):656-665·Zbl 06195968号 ·doi:10.1080/01621459.2012.762328
[40] Nishihara,R.、Murray,I.和Adams,R.P.(2014)。“具有广义椭圆切片采样的并行MCMC”,《机器学习研究杂志》,15(1):2087-2112·Zbl 1319.60153号
[41] Peterson,C.、Vannucci,M.、Karakas,C.、Choi,W.、Ma,L.和Meletic-Savatic,M.(2013)。“利用贝叶斯自适应图形套索和先验信息推断代谢网络”,《统计学及其界面》,6(4):547·Zbl 1326.92028号 ·doi:10.4310/SII.2013.v6.n4.a12
[42] R核心团队(2018年)。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。URLhttps://www.R-project.org/。
[43] Rocková,V.和George,E.I.(2014)。“EMVS:贝叶斯变量选择的EM方法”,《美国统计协会杂志》,109(506):828-846·Zbl 1367.62049号 ·doi:10.1080/01621459.2013.869223
[44] Roverato,A.(2002年)。“非可分解图的超逆Wishart分布及其在高斯图形模型贝叶斯推断中的应用”,《斯堪的纳维亚统计杂志》,29(3):391-411·Zbl 1036.62027号 ·doi:10.1111/1467-9469.00297
[45] Serina,P.、Riley,I.、Stewart,A.、James,S.L.、Flaxman,A.D.、Lozano,R.、Hernandez,B.、Mooney,M.D.、Luning,R.和Black,R.等人(2015年)。“提高将死因分配给口头尸检的关税方法的性能”,BMC医学,13(1):1。
[46] Talhouk,A.、Doucet,A.和Murphy,K.(2012年)。“具有稀疏逆相关矩阵的多元概率模型的有效贝叶斯推断”,《计算与图形统计杂志》,21(2015年2月):739-757。
[47] Wang,H.(2015)。“扩大规模:图形模型中的随机搜索结构学习”,《贝叶斯分析》,10(2):351-377·Zbl 1335.62068号 ·doi:10.1214/14-BA916
[48] Wang,H.等人(2012)。“贝叶斯图形套索模型和有效的后验计算”,《贝叶斯分析》,7(4):867-886·Zbl 1330.62041号 ·doi:10.1214/12-BA729
[49] 薛,L·Zbl 1373.62138号 ·doi:10.1214/12-AOS1041
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。