×

基于精确计数的空间扫描统计对热点簇检测的评估。 (英语) Zbl 1430.62230号

摘要:在本文中,我们提出了一种基于地图数据集链接信息的空间簇检测新方法。空间扫描统计在天文学、生物监测、自然灾害和林业等领域广泛用于检测热点簇(或冷点簇)。这种方法基于寻找一个连通的区域子集的思想,该子集可以使整个研究区域的可能性最大化。为了检测聚集高风险区域以达到最大似然的热点簇,我们只需从连接的区域子集的所有模式中搜索此类簇。然而,除非研究区域内的区域极少数,否则由于相连区域模式的总数通常会变得巨大,因此我们无法调查所有这些模式。这意味着我们无法知道根据某些规则(例如使用以前的研究)获得的检测到的热点在给定的研究区域内是否具有真正的最大可能性。零抑制二元决策图(ZDD)是频繁项集挖掘的一种方法,它使我们能够在实际计算负载下提取所有潜在的聚类区域。在这项研究中,我们提出了一种使用基于ZDD的枚举的热点检测方法,并将其应用于北卡罗来纳州的婴儿猝死综合征。这种全新的方法使我们能够检测真的具有真正最大可能性的热点簇。为了评估我们提出的方法,我们将其与现有的方法(如柔性扫描和梯队扫描)的性能进行了比较,并讨论了它们对不同目的的热点检测的适用性。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)

软件:

SaTS扫描
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Anselin,L.(1995)。空间关联的本地指标——LISA。地理分析,27(2),93-115·doi:10.1111/j.1538-46321995.tb00338.x
[2] Besag,J.E.和Newell,J.(1991)。罕见疾病簇的检测。英国皇家统计学会杂志,A辑,154(1),143-155·doi:10.2307/2982708
[3] Berke,O.(2004)。探索性疾病绘图:从区域计数数据中克里格空间风险函数。《国际健康地理学杂志》,3(1),18·doi:10.1186/1476-072X-3-18
[4] Cressie,N.(1992年)。使用经验贝叶斯预测因子平滑区域地图。地理分析,24(1),75-95·doi:10.1111/j.1538-4632.1992.tb00253.x
[5] Cressie,N.和Chan,N.H.(1989年)。区域变量的空间建模。美国统计协会杂志,84,393-401·Zbl 1248.62211号 ·doi:10.1080/01621459.1989.10478783
[6] Cuzick,J.和Edwards,R.(1990年)。非均匀种群的空间聚类。英国皇家统计学会杂志,B辑,52(1),73-104·Zbl 0703.62069号
[7] Duczmal,L.和Assunçáo,R.(2004)。一种用于检测任意形状空间簇的模拟退火策略。计算统计与数据分析,45(2),269-286·Zbl 1429.62238号 ·doi:10.1016/S0167-9473(02)00302-X
[8] Dwass,M.(1957)。非参数假设的改良随机化检验。《数理统计年鉴》,28(1),181-187·Zbl 0088.35301号 ·doi:10.1214/aoms/1177707045
[9] Huang,L.、Kulldorff,M.和Gregorio,D.(2007)。生存数据的空间扫描统计。生物计量学,63(1),109-118·Zbl 1124.62076号 ·doi:10.1111/j.1541-0420.2006.00661.x
[10] Huang,L.、Tiwari,R.C.、Zuo,Z.、Kulldorff,M.和Feuer,E.J.(2009)。异质人口数据的加权正态空间扫描统计。美国统计协会杂志,104886-898·Zbl 1388.62186号 ·doi:10.1198/jasa.2009.ap07613
[11] Inoue,T.、Takano,K.、Watanabe,T..、Kawahara,J.、Yoshinaka,R.、Kishimoto,A.等人(2014)。保证误差界的配电网损耗最小化。IEEE智能电网汇刊,5(1),102-111·doi:10.1109/TSG.2013.2288976
[12] Ishioka,F.和Kurihara,K.(2012年)。使用梯队扫描检测空间簇。《第20届国际计算统计会议论文集》(COMPSTAT2012),海德堡:Physica-Verlag,341-352。
[13] Ishioka,F.、Kurihara,K.、Suito,H.、Horikawa,Y.和Ono,Y.(2007年)。三维空间数据热点检测及其在环境污染数据中的应用。《可持续社会环境科学杂志》,1,15-24·doi:10.3107/jess.1.15
[14] Jung,I.、Kulldorff,M.和Klassen,A.C.(2007年)。有序数据的空间扫描统计。医学统计学,26(7),1594-1607·数字对象标识代码:10.1002/sim.2607
[15] Jung,I.、Kulldorff,M.和Richard,O.J.(2010年)。多项式数据的空间扫描统计。医学统计学,29(18),1910-1918·数字对象标识代码:10.1002/sim.3951
[16] Kawahara,J.、Inoue,T.、Iwashita,H.和Minato,S.(2017a)。基于边界的搜索,用于枚举具有压缩表示的所有约束子图。IEICE电子、通信和计算机科学基础汇刊,E100-A(9),1773-1784·doi:10.1587/transfun。E100.A.1773号文件
[17] Kawahara,J.、Saitoh,T.、Suzuki,H.和Yoshinaka,R.(2017b)。通过用ZDD扩充这两种有代表性的方法来解决最长的单程集问题和枚举字母图。S.Phon-Amnuaisuk、T.-W.Au和S.Omar(编辑),《信息系统中的计算智能:信息系统中计算智能会议记录》(CIIS 2016),查姆:斯普林格出版社,294-305。
[18] Kawahara,J.、Horiyama,T.、Hotta,K.和Minato,S.(2017c)。在视差范围内生成图分区的所有模式。第11届国际算法与计算会议论文集(WALCOM2017),119-131·Zbl 1485.68189号
[19] Knuth,D.E.(2011)。计算机编程艺术,第4A卷,组合算法,第1部分(第1版)。Addison-Wesley Professional公司·Zbl 1354.68001号
[20] 库尔多夫,M.(1997)。空间扫描统计。《统计学中的传播:理论与方法》,26(6),1481-1496·Zbl 0920.62116号 ·数字对象标识代码:10.1080/03610929708831995
[21] Kulldorff,M.和哈佛医学院,波士顿和信息管理服务公司(2018年)。SatScan™v9.6:空间和时空扫描统计软件。http://www.satscan.org/。2018年7月1日查阅。
[22] Kulldorff,M.、Huang,L.和Konty,K.(2009年)。基于正态概率模型的连续数据扫描统计。国际健康地理学杂志,8,58·doi:10.1186/1476-072X-8-58
[23] Kulldorff,M.和Nagarwalla,N.(1995年)。空间疾病集群:检测和推断。医学统计学,14(8),799-810·数字对象标识代码:10.1002/sim.4780140809
[24] Kurihara,K.(2004)。地理空间格点数据的分类及其图形表示。在D.Banks等人(编辑)的《分类、聚类和数据挖掘应用》(第251-258页)中。纽约:斯普林格。
[25] 劳森·A·B和克拉克·A(2002)。空间混合相对风险模型在疾病制图中的应用。医学统计学,21(3),359-370·doi:10.1002/sim.1022
[26] Minato,S.(1993)。用于组合问题中集合操作的零抑制BDD。第30届ACM/IEEE设计自动化会议论文集,272-277。
[27] Moran,P.A.P.(1948年)。统计图的解释。英国皇家统计学会杂志,B辑,10(2),243-251·Zbl 0035.08304号
[28] Myers,W.L.、Patil,G.P.和Joly,K.(1997)。天气区域监测关注领域的梯队方法。环境与生态统计,4(2),131-152·doi:10.1023/A:1018518327329
[29] Openshaw,S.、Charlton,M.、Wymer,C.和Craft,A.(1987年)。用于自动分析点数据集的mark-1地理分析机。国际地理信息系统杂志,1(4),335-358·doi:10.1080/02693798708927821
[30] Patil,G.P.和Taillie,C.(2004)。上层设置扫描统计,用于检测任意形状的热点。环境与生态统计,11(2),183-197·doi:10.1023/B:EEST.0000027208.48919.7e
[31] Sekine,K.、Imai,H.和Tani,S.(1995年)。计算中等大小图的Tutte多项式。第六届算法与计算国际研讨会论文集(ISAAC1995),224-233·Zbl 1512.68251号
[32] Takahashi,K.、Yokoyama,T.和Tango,T.(2010年)。FleXScan v3.1.2:灵活扫描统计软件。日本国立公共卫生研究所。https://sites.google.com/site/flexscansoftware/。2018年7月1日查阅。
[33] Takizawa,A.,Takechi,Y.,Ohta,A.,Katoh,N.,Inoue,T.,Horiyama,T.、Kawahara,J.和Minato,S.(2013年)。基于ZDD的疏散规划区域划分枚举。2013年第11届运筹学及其在工程、技术和管理中的应用国际研讨会(ISORA 2013),第11届国际研讨会论文集,1-8。
[34] Tango,T.(1995)。用于检测比率疾病的“一般”和“焦点”聚集的一类测试。医学统计学,14(21-22),2323-2334·doi:10.1002/sim.4780142105
[35] Tango,T.(2000年)。一种针对空间疾病聚类的测试,经多次测试调整。医学统计学,19(2),191-204·doi:10.1002/(SICI)1097-0258(20000130)19:2<191::AID-SIM281>3.0.CO;第2季度
[36] Tango,T.(2008)。具有限制似然比的空间扫描统计。日本生物统计学杂志,29(2),75-95·doi:10.5691/jjb.29.75
[37] Tango,T.和Takahashi,K.(2005年)。用于检测簇的灵活空间扫描统计。国际健康地理学杂志,4,11·doi:10.1186/1476-072X-4-11
[38] Tango,T.和Takahashi,K.(2012年)。用于检测疾病簇的具有限制似然比的灵活空间扫描统计。《医学统计学》,31(30),4207-4218·数字对象标识代码:10.1002/sim.5478
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。