×

贝叶斯非参数多元空间混合效应模型及其在美国社区调查特殊表格中的应用。 (英语) Zbl 1498.62320号

摘要:利用多元空间相关性来提高使用美国社区调查数据和其他抽样调查数据进行估算的准确性,是数据用户和联邦统计机构最近感兴趣的一个话题。一种策略是使用具有高斯观测模型和潜在高斯过程模型的多元空间混合效应模型。在实践中,这种方法适用于各种各样的表格。然而,在数据表现出地理区域内或跨地理区域的异质性和/或数据稀疏的情况下,高斯假设可能存在问题,并导致表现不佳。为了弥补这些情况,我们提出了一个多变量分层贝叶斯非参数混合效应空间混合模型,以增加模型的灵活性。集群的数量是以数据驱动的方式自动选择的。通过模拟研究和激励美国社区调查数据的特殊表格应用,证明了我们方法的有效性。

MSC公司:

62第25页 统计学在社会科学中的应用
62D05型 抽样理论、抽样调查
2015年1月62日 贝叶斯推断
62G05型 非参数估计
62H11型 定向数据;空间统计学
62立方米 空间过程推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ABOWD,J.M.(2018)。美国人口普查局采用差别隐私。会议记录24第届ACM SIGKDD国际知识发现与数据挖掘会议2867-2867.
[2] Banerjee,S.、Carlin,B.P.和Gelfand,A.E.(2015)。空间数据的层次化建模与分析,第2版。统计学和应用概率专著135.佛罗里达州博卡拉顿CRC出版社·Zbl 1358.62009号
[3] 布拉德利·J·R、克雷西·N和史·T(2016)。当数据集可能非常大时,对空间预测因子进行比较。统计调查。10 100-131. ·Zbl 1347.62083号 ·doi:10.1214/16-SS115
[4] 布拉德利·J.R.、霍兰·S.H.和威克利·C.K.(2015)。高维区域数据的多维时空模型,应用于纵向雇主-家庭动态。附录申请。斯达。9 1761-1791年·Zbl 1397.62356号 ·doi:10.1214/15-AOAS862
[5] 布拉德利·J.R.、霍兰·S.H.和威克利·C.K.(2018)。高维计值数据的计算效率多元时空模型(与讨论)。贝叶斯分析。13 253-310. ·Zbl 1392.62148号 ·doi:10.1214/17-BA1069
[6] 布拉德利·J.R.、威克利·C.K.和霍兰·S.H.(2017)。使用空间聚集误差准则对多尺度空间过程进行区域化。J.R.Stat.Soc.系列。B.统计方法。79 815-832. ·Zbl 1411.86007号 ·doi:10.1111/rssb.12179
[7] CRESSIE,N.和WIKLE,C.K.(2011年)。时空数据统计.概率论与统计学中的威利级数新泽西州霍博肯威利·Zbl 1273.62017年
[8] DIGGLE,P.J.、TAWN,J.A.和MOYEED,R.A.(1998年)。基于模型的地质统计学。J.R.Stat.Soc.系列。C.申请。斯达。47 299-350. ·Zbl 0904.62119号 ·数字对象标识代码:10.1111/1467-9876.00113
[9] Duan,J.A.、Guindani,M.和Gelfand,A.E.(2007年)。广义空间Dirichlet过程模型。生物特征94 809-825. ·Zbl 1156.62064号 ·doi:10.1093/biomet/asm071
[10] Escobar,M.D.和West,M.(1995)。使用混合物的贝叶斯密度估计和推断。J.Amer。统计师。协会。90 577-588. ·兹比尔0826.62021 ·doi:10.1080/01621459.1995.10476550
[11] FAY,R.E.和HERRIOT,R.A.(1979年)。小地方收入估算:James-Stein程序在人口普查数据中的应用。J.Amer。统计师。协会。74 269-277·doi:10.1080/01621459.1979.10482505
[12] FAY,R.和TRAIN,G.(1995年)。各州和县的收入和贫困特征的调查和基于模型的后意识估计方面。联合统计会议以下为:政府统计科会议记录154-159.
[13] Ferguson,T.S.(1973)。一些非参数问题的贝叶斯分析。安。统计师。1 209-230. ·Zbl 0255.62037号
[14] FERNáNDEZ,C.和GREEN,P.J.(2002)。通过混合建模空间相关数据:贝叶斯方法。J.R.Stat.Soc.系列。B.统计方法。64 805-826. ·兹比尔1067.62029 ·数字对象标识代码:10.1111/1467-9868.00362
[15] Gelfand,A.E.、Kottas,A.和MacEachern,S.N.(2005年)。基于Dirichlet过程混合的贝叶斯非参数空间建模。J.Amer。统计师。协会。100 1021-1035. ·Zbl 1117.62342号 ·doi:10.1198/0162145000002078
[16] Gelman,A.和Rubin,D.B.(1992年)。使用多序列的迭代模拟推断。统计师。科学。7 457-472. ·Zbl 1386.65060号
[17] GEWEKE,J.(1992)。评估基于抽样的后验矩计算方法的准确性。贝叶斯统计4(J.M.Bernardo、J.O.Berger、A.P.Dawid和A.F.M.Smith编辑)169-193年。牛津大学出版社,纽约。
[18] 新泽西州HIGHAM(1988)。计算最近对称半正定矩阵。线性代数应用。103 103-118. ·Zbl 0649.65026号 ·doi:10.1016/0024-3795(88)90223-6
[19] HJORT,N.L.、HOLMES,C.、MüLLER,P.和WALKER,S.G.(2010年)。贝叶斯非参数28.剑桥大学出版社,剑桥。
[20] HOSSAIN,M.M.、LAWSON,A.B.、CAI,B.、CHOI,J.、LIU,J.和KIRBY,R.S.(2013)。小面积疾病簇估计的时空破粘过程。环境。经济。斯达。20 91-107. ·doi:10.1007/s10651-012-0209-0
[21] HOSSEINPOURI,M.和KHALEDI,M.J.(2019)。针对空间数据的特定于区域的断棒过程。统计师。论文60 199-221. ·Zbl 1420.62413号 ·doi:10.1007/s00362-016-0833-0
[22] Hughes,J.和Haran,M.(2013)。空间广义线性混合模型的降维和消除混淆。J.R.Stat.Soc.系列。B.统计方法。75 139-159. ·Zbl 07555442号 ·doi:10.1111/j.1467-9868.2012.01041.x
[23] Ishwaran,H.和James,L.F.(2001)。破胶前期吉布斯取样方法。J.Amer。统计师。协会。96 161-173. ·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[24] JAMES,W.和STEIN,C.(1961年)。二次损失估计。程序. 4第十届伯克利交响乐团。数学。统计师。和探针.,第一卷361-379. 加州大学出版社,加州伯克利·Zbl 1281.62026号
[25] JANICKI,R.、RAIM,A.M.、HOLAN,S.H.和MAPLES,J.(2022)。补充“贝叶斯非参数多元空间混合效应模型及其在美国社区调查特殊表格中的应用”https://doi.org/10.1214/21-AOAS1494SUPA网站, https://doi.org/10.1214/21-AOAS1494SUPPB
[26] Jones,G.L.、Haran,M.、Caffo,B.S.和Neath,R.(2006)。马尔可夫链的固定宽度输出分析蒙特卡罗。J.Amer。统计师。协会。101 1537-1547. ·Zbl 1171.62316号 ·doi:10.1198/016214500000492
[27] JUDKINS,D.R.(1990年)。Fay方差估计方法。J.关闭状态。6 223-239.
[28] Korwar,R.M.和Hollander,M.(1973年)。对Dirichlet过程理论的贡献。安·普罗巴伯。1 705-711. ·Zbl 0264.60084号 ·doi:10.1214/aop/1176996898
[29] KOTTAS,A.(2016)。疾病发病率数据的贝叶斯非参数建模。空间流行病学手册363-374. CRC出版社/CRC,伦敦。
[30] MOLINA,I.、NANDRAM,B.和RAO,J.N.K.(2014)。一般参数的小面积估计及其在贫困指标中的应用:层次贝叶斯方法。附录申请。斯达。8 852-885. ·Zbl 1454.62489号 ·doi:10.1214/13-AOAS702
[31] MORAN,P.A.P.(1950)。关于连续随机现象的注释。生物特征37 17-23. ·兹比尔0041.45702 ·doi:10.1093/biomet/37.1-2.17
[32] Neal,R.M.(2000)。Dirichlet过程混合模型的马尔可夫链抽样方法。J.计算。图表。统计师。9 249-265. ·doi:10.2307/1390653
[33] NEELON,B.、GELFAND,A.E.和MIRANDA,M.L.(2014)。区域数据的多元空间混合模型:检查标准化考试分数的区域差异。J.R.Stat.Soc.系列。C.申请。斯达。63 737-761. ·doi:10.1111/rssc.12061
[34] PORTER,A.T.、HOLAN,S.H.和WIKLE,C.K.(2015)。贝叶斯半参数层次经验似然空间模型。J.统计学家。计划。推断165 78-90. ·Zbl 1326.62079号 ·doi:10.1016/j.jspi.2015.04.002
[35] QIU,Y.和MEI,J.(2019)。RSpectra:大规模特征值和奇异值分解问题的求解器。R包版本0.16-0。
[36] Rao,J.N.K.和Molina,I.(2015)。小面积估算,第2版。测量方法学中的威利级数新泽西州霍博肯威利·Zbl 1323.62002号 ·doi:10.1002/9781118735855
[37] REICH,B.J.和FUENTES,M.(2015)。空间贝叶斯非参数方法。生物统计学中的非参数贝叶斯推断.前面。普罗巴伯。统计科学。347-357. 查姆施普林格·Zbl 1381.62092号
[38] R核心团队(2019年)。R: 统计计算语言和环境R统计计算基础。
[39] Sethuraman,J.(1994)。Dirichlet先验的构造性定义。统计师。西尼卡4 639-650. ·Zbl 0823.62007号
[40] STAN开发团队(2018年)。RStan:与Stan的R接口。
[41] Stephens,M.(2000年)。处理混合模型中的标签切换。J.R.Stat.Soc.系列。B.统计方法。62 795-809之间·Zbl 0957.62020号 ·doi:10.1111/1467-9868.00265
[42] TORRIERI,N.(2014)。美国社区调查设计和方法。美国人口普查局技术报告
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。