×

使用受限中餐厅流程的疾病聚类的贝叶斯方法。 (英语) Zbl 1439.62231号

摘要:确定疾病集群(特定疾病的异常高发病率地区)是流行病学和公共卫生领域的一个常见问题。我们描述了一个用于疾病聚类的贝叶斯非参数混合模型,该模型将聚类限制为由相邻区域单元组成。这是通过修改与Ewen抽样分布相关联的可交换分区概率函数来实现的。我们将结果称为受限中餐厅流程之前的结果,因为相关的完全条件分布类似于标准中餐厅流程。该模型使用合成数据集进行了说明,并在德国口腔癌死亡率的应用中进行了说明。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alquier,P.、Friel,N.、Everitt,R.和Boland,A.(2016)。噪声蒙特卡罗:具有近似转移核的马尔可夫链的收敛性。,统计与计算26 29-47·Zbl 1342.60122号 ·doi:10.1007/s11222-014-9521-x
[2] Anderson,C.、Lee,D.和Dean,N.(2014年)。贝叶斯疾病映射中的聚类识别。,生物统计学15 457-469。
[3] Antoniak,C.(1974)。Dirichlet过程的混合及其在贝叶斯非参数问题中的应用。,统计年鉴2 1152-1174·Zbl 0335.60034号 ·doi:10.1214/aos/1176342871
[4] Banerjee,S.、Carlin,B.P.和Gelfand,A.E.(2014)。,空间数据的分层建模和分析。查普曼和霍尔/CRC·Zbl 1358.62009号
[5] Besag,J.和Newell,J.(1991)。罕见疾病簇的检测。,英国皇家统计学会杂志。系列A(社会统计)143-155。
[6] Blackwell,D.&MacQueen,J.B.(1973)。弗格森通过Pólya Urn方案配送。,统计年鉴1 353-355·Zbl 0276.62010 ·doi:10.1214操作系统/1176342372
[7] Blei,D.M.和Frazier,P.I.(2011年)。依赖距离的中国餐厅流程。,机器学习研究杂志12 2461-2488·Zbl 1280.68157号
[8] Charras-Garrido,M.、Abrial,D.、De Goör,J.、Dachian,S.和Peyrard,N.(2012年)。基于离散隐马尔可夫随机场的疾病风险映射分类方法。,生物统计学13 241-255·Zbl 1437.62412号
[9] Dahl,D.B.(2008)。集合划分的基于距离的概率分布及其在贝叶斯非参数中的应用。,JSM程序。弗吉尼亚州亚历山大美国统计协会贝叶斯统计科学部分。
[10] Dahl,D.B.,Day,R.&Tsai,J.W.(2017)。成对信息索引的随机分区分布。,美国统计协会杂志112 721-732。
[11] Damien,P.、Wakefield,J.和Walker,S.(1999年)。使用辅助变量的贝叶斯非共轭分层模型的吉布斯抽样。,英国皇家统计学会杂志:B辑(统计方法)61 331-344·Zbl 0913.62028号 ·doi:10.1111/1467-9868.00179
[12] Ferguson,T.S.(1973)。一些非参数问题的贝叶斯分析。,统计年鉴1 209-230·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[13] Fernández,C.和Green,P.J.(2002)。通过混合物对空间相关数据进行建模:贝叶斯方法。,皇家统计学会杂志:B辑(统计方法)64 805-826·Zbl 1067.62029号 ·数字对象标识代码:10.1111/1467-9868.00362
[14] Fitzpatrick,M.C.、Preisser,E.L.、Porter,A.、Elkinton,J.、Waller,L.A.、Carlin,B.P.和Ellison,A.M.(2010)。基于贝叶斯区域缠绕的生态边界检测。,生态学91 3448-3455。
[15] Fuentes-García,R.、Mena,R.H.和Walker,S.G.(2010年)。基于Dirichlet过程混合模型的分类概率。,分类期刊27 389-403·Zbl 1337.62130号 ·doi:10.1007/s00357-010-9061-9
[16] Gangnon,R.E.和Clayton,M.K.(2000年)。空间疾病聚类的贝叶斯检测和建模,生物统计学56 922-935·Zbl 1060.62610号 ·文件编号:10.1111/j.0006-341X.2000.00922.x
[17] Ghosh,S.、Ungureanu,A.B.、Sudderth,E.B.和Blei,D.M.(2011年)。基于空间距离的中餐厅图像分割处理。年,《神经信息处理系统进展》。1476-1484.
[18] Gnedin,A.和Pitman,J.(2006)。可交换吉布斯分区和斯特林三角形。,数学科学杂志138 5674-5685·Zbl 1293.60010号
[19] Gómez-Rubio,V.,Ferrándiz-Ferragud,J.&López-Quílez,A.(2005)。《利用R.检测疾病簇》,《地理系统杂志》7 189-206。
[20] Gómez-Rubio,V.,Molitor,J.&Moraga,P.(2018)。用于疾病映射和疾病簇检测的快速贝叶斯分类。年,《环境与气候研究中的定量方法》。施普林格,1-27。
[21] Goujon-Bellec,S.,Demoury,C.,Guyot-Goubin,A.,Hémon,D.&Clavel,J.(2011)。大范围罕见疾病簇的检测:簇检测方法的性能。,国际卫生地理杂志10 53。
[22] Green,P.J.和Richardson,S.(2002年)。隐马尔可夫模型和疾病映射。,美国统计协会杂志97 1055-1070·兹比尔1046.62117 ·doi:10.1198/016214502388618870
[23] Guhaniyogi,R.(2017)。贝叶斯非参数区域搜索小比例尺地图及其在康涅狄格州膀胱癌数据中的应用。,医学统计36 4007-4027。
[24] Hartigan,J.A.(1990年)。分区模型。,统计学理论与方法通信19 2745-2756。
[25] Heinzl,F.和Tutz,G.(2014年)。具有群融合套索惩罚的线性混合模型中的聚类。,生物医学杂志56 44-68·Zbl 1280.62076号 ·doi:10.1002/bimj.201200111
[26] Hubert,L.和Arabie,P.(1985)。比较分区。,分类杂志2 193-218·Zbl 0587.62128号
[27] Knorr-Held,L.&Raßer,G.(2000)。疾病图中簇和不连续性的贝叶斯检测。,生物统计学56 13-21·Zbl 1060.62629号 ·文件编号:10.1111/j.0006-341X.2000.00013.x
[28] 库尔多夫,M.(1997)。空间扫描统计。,统计学中的通信——理论和方法26 1481-1496·Zbl 0920.62116号 ·数字对象标识代码:10.1080/03610929708831995
[29] Kulldorff,M.和Nagarwalla,N.(1995年)。空间疾病集群:检测和推断。,医学统计学14 799-810。统一资源定位地址http://dx.doi.org/10.1002/sim.4780140809。
[30] Kulldorff,M.,Tango,T.&Park,P.J.(2003)。疾病聚类测试的功效比较。,计算统计与数据分析42 665-684·Zbl 1429.62558号 ·doi:10.1016/S0167-9473(02)00160-3
[31] Lau,J.W.和Green,P.J.(2007)。基于贝叶斯模型的聚类程序。,计算与图形统计杂志16 526-558。
[32] Lee,J.、Quintana,F.A.、Müller,P.和Trippa,L.(2013)。定义物种采样模型的预测概率函数。,统计科学:数理统计研究所评论期刊28 209·Zbl 1331.62152号
[33] Li,C.、Phung,D.、Rana,S.和Venkatesh,S.(2013)。利用距离相关中餐馆过程中的辅助信息进行数据聚类。2013年IEEE国际多媒体与博览会(ICME)。IEEE,1-6。
[34] Li,C.、Rana,S.、Phung,D.和Venkatesh,S.(2014)。使用层次贝叶斯模型,利用边信息规范EMRS中的主题发现。2014年,第22届模式识别国际会议。IEEE,1307-1312。
[35] Li,C.,Rana,S.,Phung,D.&Venkatesh,S.(2015a)。约束贝叶斯非参数模型的小方差渐近性。年,太平洋亚洲知识发现和数据挖掘会议。施普林格,92-105。
[36] Li,C.,Rana,S.,Phung,D.&Venkatesh,S.(2016a)。基于边信息依赖的中餐馆过程的数据聚类。,知识和信息系统47 463-488。
[37] Li,C.,Rana,S.,Phung,D.&Venkatesh,S.(2016b)。数据聚类中具有成对约束的Dirichlet过程混合模型,数据科学年鉴3 205-223。
[38] Li,C.,Rana,S.,Phung,D.&Venkatesh,S.(2016c)。电子病历知识发现的层次贝叶斯非参数模型。,基于知识的系统99 168-182。
[39] 李春云(2015)。,利用贝叶斯非参数模型中的边信息及其应用。迪肯大学博士论文。
[40] Li,P.,Banerjee,S.,Hanson,T.A.&McBean,A.M.(2015b)。检测区域数据差异边界的贝叶斯模型。,中国统计局385-402·兹比尔1480.62190
[41] Loschi,R.H.和Cruz,F.R.(2005)。产品分区模型的扩展:计算更改的概率。,计算统计与数据分析48 255-268·Zbl 1429.62084号 ·doi:10.1016/j.csda.2004.03.003
[42] Lu,H.&Carlin,B.P.(2005)。用于地理边界分析的贝叶斯区域漫游。,地理分析37 265-285。
[43] Lu,H.、Reilly,C.S.、Banerjee,S.和Carlin,B.P.(2007)。基于邻接建模的贝叶斯区域游动。,环境与生态统计14 433-452。
[44] MacEachern,S.N.&Müller,P.(1998年)。估计Dirichlet过程模型的混合。,计算与图形统计杂志7 223-338。
[45] Martínez,A.F.、Mena,R.H.等人(2014年)。关于马尔可夫系统中的非参数变化点检测模型。,贝叶斯分析9 823-858·Zbl 1327.62450号 ·doi:10.1214/14-BA878
[46] Moraga,P.&Montes,F.(2011年)。利用LISA功能检测空间疾病簇。,医学统计30 1057-1071。
[47] Morton-Jones,T.、Diggle,P.和Elliott,P.(1999)。假定来源周围过度环境风险的调查:协变量调整的斯通检验。,医学统计18 189-197。
[48] Müller,P.,Quintana,F.&Rosner,G.L.(2011年)。协变量回归的产品分割模型。,计算与图形统计杂志20 260-278。
[49] Neal,R.(2000)。Dirichlet过程混合模型的马尔可夫链抽样方法。,计算与图形统计杂志9 249-265。
[50] Openshaw,S.、Charlton,M.、Wymer,C.和Craft,A.(1987年)。用于自动分析点数据集的mark-1地理分析机。,国际地理信息系统杂志1 335-358。
[51] Page,G.L.,Quintana,F.A.等人(2016年)。空间产品分区模型。,贝叶斯分析11 265-298·Zbl 1359.62401号 ·doi:10.1214/15-BA971
[52] 皮特曼,J.(1995)。可交换和部分可交换随机分区。,概率论及相关领域102 145-158·Zbl 0821.60047号 ·doi:10.1007/BF01213386
[53] Pitman,J.(1996)。布莱克威尔-麦昆瓮计划的一些进展。,课堂讲稿-专题系列245-267。
[54] Pitman,J.和Yor,M.(1997)。从稳定子函数导出的双参数Poisson-Dirichlet分布。,概率年鉴25 855-900·Zbl 0880.60076号 ·doi:10.1214/aop/1024404422
[55] Plummer,M.,Best,N.,Cowles,K.&Vines,K.(2009年)。,CODA:MCMC的输出分析和诊断。R包版本0.13-4。
[56] 波托夫,R.F.和惠廷希尔,M.(1966a)。均匀性检验:I.二项式和多项式分布。,生物特征53 167-182·Zbl 0142.15303号
[57] Potthoff,R.F.和Whittinghill,M.(1966b)。均匀性测试:Ii。泊松分布。,生物特征183-190·兹伯利0142.15303
[58] Robert,C.P.和Casella,G.(2005)。,蒙特卡罗统计方法(统计学中的斯普林格文本)。美国新泽西州塞考克斯:斯普林格·弗拉格·Zbl 1096.62003年
[59] Rodríguez,A.和Quintana,F.A.(2015)。基于残差分配模型的物种抽样序列。,统计规划与推断杂志157 108-120·Zbl 1364.62067号
[60] Smith,A.F.&Roberts,G.O.(1993年)。通过吉布斯采样器和相关马尔可夫链蒙特卡罗方法进行贝叶斯计算。,英国皇家统计学会杂志。系列B(方法学)3-23·Zbl 0779.62030号 ·doi:10.1111/j.2517-6161.1993.tb01466.x
[61] Stone,R.A.(1988)。假定来源周围过度环境风险的调查:统计问题和拟议测试。,医学统计学7 649-660。
[62] Tango,T.(1995)。一类检测罕见疾病“一般”和“集中”聚集的测试。,医学统计14 2323-2334。
[63] Tango,T.和Takahashi,K.(2005年)。用于检测簇的灵活形状的空间扫描统计。,国际卫生地理杂志4 11。
[64] Wakefield,J.&Kim,A.(2013年)。聚类检测的贝叶斯模型。,生物统计学14 752-765。
[65] Waller,L.A.、Hill,E.G.和Rudd,R.A.(2006年)。权力地理:异质人群中集群和集群测试的统计性能。,医学统计25 853-865。
[66] Wang,H.和Rodríguez,A.(2014)。使用对数线性模型和广义拉索惩罚确定佛罗里达州的儿科癌症集群。,统计与公共政策1 86-96。
[67] Wehrhahn,C.、Leonard,S.、Rodriguez,A.和Xifara,T.(2020)。补充材料:“使用限制性中餐厅流程进行疾病聚类的贝叶斯方法”。DOI:,10.1214/20-EJS1696附录·Zbl 1439.62231号 ·doi:10.1214/20-EJS1696
[68] Weinstock,M.A.(1981年)。用于检测聚类的通用扫描统计测试。,国际流行病学杂志10 289-293。
[69] A.惠特莫尔·兹比尔062862103 ·doi:10.1093/biomet/74.3.631
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。