×

尺度对空间混杂偏差和空间回归估计精度的重要性。 (英语) Zbl 1328.62596号

摘要:回归模型中的残差通常在空间上相关。突出的例子包括环境流行病学研究,以了解污染物对健康的慢性影响。我考虑了剩余空间结构对回归系数的偏差和精度的影响,开发了一个简单的框架,在该框架中可以理解关键问题并获得信息丰富的分析结果。当未测量混杂将空间结构引入残差时,具有空间随机效应的回归模型以及克里金和惩罚样条等密切相关的模型都会有偏差,即使残差方差分量已知。分析和仿真结果表明,偏差如何取决于协变量和残差的空间尺度:只有当协变量的变化小于未测量混杂的尺度时,才能通过拟合空间模型来减少偏差。我还讨论了当残差独立于协变量时,残差和协变量的尺度如何影响效率和不确定性估计。在关于黑碳颗粒物空气污染与出生体重之间关系的应用中,控制大规模空间变化似乎减少了未测量混杂因素的偏差,同时增加了估计污染影响的不确定性。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62页第12页 统计在环境和相关主题中的应用
92 C50 医疗应用(通用)
62甲12 多元分析中的估计
62G05型 非参数估计
62立方米 空间过程推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Augustin,N.、Lang,S.、Musio,M.和von Wilpert,K.(2007年)。巴登-符腾堡森林松树针叶损失的空间模型:贝叶斯结构加性回归的应用。J.罗伊。统计师。Soc.序列号。C 56 29-50·Zbl 1490.62391号
[2] Beelen,R.、Hoek,G.、Fischer,P.、Brandt,P.和Brunekreef,B.(2007年)。队列研究中估计的长期室外空气污染浓度。大气环境41 1343-1358。
[3] Biggeri,A.、Bonannini,M.、Catelan,D.、Divino,F.、Dreassi,E.和Lagazio,C.(2005)。潜在因素的贝叶斯生态回归:大气污染物、排放和肺癌死亡率。环境与生态统计12 397-409·doi:10.1007/s10651-005-1521-8
[4] Bivand,R.(1980)。空间自相关观测相关系数估计的蒙特卡罗研究。Quaestions地理6 5-10。
[5] Breslow,N.E.和Clayton,D.G.(1993年)。广义线性混合模型中的近似推理。J.Amer。统计师。协会88 9-25·Zbl 0775.62195号 ·doi:10.2307/2290687
[6] Buja,A.、Hastie,T.和Tibshirani,R.(1989)。线性平滑器和相加模型。安。统计师。17 453-510. ·Zbl 0689.62029号 ·doi:10.1214/aos/1176347115
[7] Burden,S.、Guha,S.,Morgan,G.、Ryan,L.、Sparks,R.和Young,L.(2005)。澳大利亚新南威尔士州缺血性心脏病急性入院患者的时空分析。环境与生态统计12 427-448·doi:10.1007/s10651-005-1517-4
[8] Burnett,R.、Ma,R.,Jerrett,M.、Goldberg,M.,Cakmak,S.、Pope III,C.和Krewski,D.(2001)。社区空气污染与死亡率之间的空间关联:分析相关地理队列数据的新方法。环境健康观点109 375-380。
[9] Cakmak,S.、Burnett,R.、Jerrett,M.、Goldberg,M.,Pope III,C.、Ma,R.,Gultekin,T.、Thun,M.和Krewski,D.(2003)。将社区空气污染与健康联系起来的大型队列研究的空间回归模型。毒理学与环境健康杂志,A部分66 1811-1823。
[10] Cerdá,M.、Tracy,M..、Messner,S.、Vlahov,D.、Tardiff,K.和Galea,S.(2009年)。轻罪警务、身体紊乱和与枪支有关的杀人:“破碎的双翼”理论的空间分析测试。流行病学20 533-541。
[11] Cho,W.(2003)。传染效应和种族贡献网络。美国政治科学杂志47 368-387。
[12] Claeskens,G.、Krivobokova,T.和Opsomer,J.(2009)。惩罚样条估计的渐近性质。生物特征96 529-544·Zbl 1170.62031号 ·doi:10.1093/biomet/asp035
[13] Clayton,D.、Bernardinelli,L.和Montomoli,C.(1993)。生态分析中的空间相关性。国际流行病学杂志22 1193-1202。
[14] Cressie,N.(1993)。《空间数据统计》,修订版,Wiley Interscience,纽约·Zbl 0799.62002号
[15] Diggle,P.、Heagerty,P.J.、Liang,K.-Y.和Zeger,S.(2002)。《纵向数据分析》,第二版,牛津大学出版社,牛津·Zbl 1031.62002号
[16] Dominici,F.、McDermott,A.和Hastie,T.(2004)。空气污染和死亡率的改进半参数时间序列模型。J.Amer。统计师。协会99 938-949·Zbl 1055.62132号 ·doi:10.1198/016214500000656
[17] Dow,M.、Burton,M.和White,D.(1982年)。网络自相关:回归和调查研究中一个基本问题的模拟研究。社交网络4 169-200。
[18] Gryparis,A.、Coull,B.、Schwartz,J.和Suh,H.(2007)。大波士顿地区移动源污染时空建模的潜变量半参数回归模型。J.罗伊。统计师。Soc.序列号。C 56 183-209·Zbl 1490.62395号 ·文件编号:10.1111/j.1467-9876.2007.00573.x
[19] Gryparis,A.、Paciorek,C.、Zeka,A.、Schwartz,J.和Coull,B.(2009年)。环境流行病学中空间错位引起的测量误差。生物统计学10 258-274。
[20] Gustafson,P.和Greenland,S.(2006年)。随机系数回归在解释剩余混杂方面的表现。生物统计学62 760-768·Zbl 1127.62024号 ·doi:10.1111/j.1541-0420.2005.00510.x
[21] He,S.、Mazumdar,S.和Arena,V.(2006)。GAM和GLM在空气污染研究中的比较研究。环境计量17 81-93·doi:10.1002/env.751
[22] Hodges,J.和Reich,B.(2010年)。添加空间相关的错误可能会破坏你喜欢的固定效果。技术报告2010-002,明尼苏达大学生物统计处。可从获取·Zbl 1217.62095号 ·doi:10.198/日期.2010.10052
[23] Houseman,E.、Coull,B.和Shine,J.(2006年)。具有时间相关协变量的非平稳负二项时间序列:波士顿港的肠球菌计数。J.Amer。统计师。协会101 1365-1376·Zbl 1171.62343号 ·doi:10.1198/016214500000627
[24] Janes,H.、Dominici,F.和Zeger,S.(2007年)。空气污染和死亡率趋势:评估未测量混杂因素的方法。流行病学18 416-423。
[25] Johnston,J.和DiNardo,J.(1997)。《计量经济学方法》,第四版,McGraw-Hill,纽约。
[26] Lawson,A.(2006年)。《空间流行病学统计方法》,第二版,威利出版社,纽约·Zbl 1096.62118号
[27] Lee,D.、Ferguson,C.和Mitchell,R.(2009)。苏格兰空气污染与健康:一项多城市研究。生物统计学10 409-423。
[28] Legendre,P.(1993)。空间自相关:问题还是新范式?生态学74 1659-1673。
[29] Lombardía,M.J.和Sperlich,S.(2007年)。固定效应和混合效应模型之间的多级回归。技术报告,Georg-August-Univ.Göttingen。可在上获取。
[30] Lu,Y.和Zeger,S.(2007)。分解回归估计量以探索“未测量”时变混杂因素的影响。马里兰州巴尔的摩约翰霍普金斯大学生物统计系技术报告159,网址:。
[31] Molitor,J.、Jerrett,M.、Chang,C.等人(2007年)。空气污染健康影响评估空间暴露模型的不确定性评估。环境健康观点115 1147-1153。
[32] Peng,R.、Dominici,F.和Louis,T.(2006)。空气污染和死亡率时间序列研究中的模型选择。J.罗伊。统计师。Soc.序列号。A 169 179-203·doi:10.1111/j.1467-985X.2006.00410.x
[33] Pope III,C.、Burnett,R.、Thun,M.、Calle,E.、Krewski,D.、Ito,K.和Thurston,G.(2002)。肺癌、心肺死亡率和长期暴露于细颗粒空气污染。美国医学会杂志287 1132-1141。
[34] Ramsay,T.、Burnett,R.和Krewski,D.(2003年)。探索空间空气污染数据广义加性模型中的偏差。环境健康展望111 1283-1288。
[35] Reich,B.、Hodges,J.和Zadnik,V.(2006年)。残差平滑对疾病映射模型中固定效应后验的影响。生物统计学62 1197-1206·Zbl 1114.62124号 ·文件编号:10.1111/j.1541-0420.2006.00617.x
[36] Rice,J.(1986年)。部分线性花键模型的收敛速度。统计师。普罗巴伯。莱特。4 203-208. ·Zbl 0628.62077号 ·doi:10.1016/0167-7152(86)90067-2
[37] Richardson,S.(2003)。流行病学应用中的空间模型。《高度结构化随机系统》(P.Green,N.Hjort and S.Richardson,eds.)237-259。牛津大学出版社,牛津。
[38] Ruppert,D.、Wand,M.和Carroll,R.(2003年)。半参数回归。剑桥大学出版社,剑桥·Zbl 1038.62042号 ·doi:10.1017/CBO9780511755453
[39] Schabenberger,O.和Gotway,C.(2005)。空间数据分析的统计方法。佛罗里达州博卡拉顿查普曼和霍尔·Zbl 1068.6206号
[40] Speckman,P.(1988)。部分线性模型中的核平滑。J.罗伊。统计师。Soc.序列号。乙50 413-436。JSTOR公司:·Zbl 0671.62045号
[41] Wakefield,J.(2007)。疾病绘图和计数数据的空间回归。生物统计学8 158-183·Zbl 1213.62178号 ·doi:10.1093/biostatistics/kxl008
[42] Waller,L.和Gotway,C.(2004)。公共卫生数据的应用空间统计。新泽西州霍博肯威利·兹比尔1057.62106 ·doi:10.1002/0471662682
[43] Wood,S.(2006)。广义可加模型:R引言。佛罗里达州博卡拉顿查普曼和霍尔·Zbl 1087.62082号
[44] Zeger,S.、Dominici,F.、McDermott,A.和Samet,J.(2007年)。医疗保险人群的死亡率和长期接触细颗粒空气污染。马里兰州巴尔的摩约翰霍普金斯大学生物统计系技术报告133,网址:。
[45] Zeka,A.、Melly,S.和Schwartz,J.(2008)。马萨诸塞州东部社会经济状况和物理环境指数对出生体重减轻和早产的影响。环境健康7 60。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。