×

重建多元时间序列中缺失的数据序列:环境数据的应用。 (英语) Zbl 1427.62105号

摘要:由于数据采集中的错误,许多统计分析中都会出现数据缺失,这可能会对从数据中得出的结论产生重大影响。例如,在环境数据中,环境保护机构通常采用的处理缺失值的标准方法是从研究中删除那些信息不完整的观测值,从而大大低估了通常用于评估空气质量的许多指标。此外,在多元时间序列中,不仅可能会出现孤立值丢失的情况,而且可能会出现一些时间序列成分的长序列丢失的情况。在这种情况下,很难仅基于序列依赖结构来重建丢失的序列。在这项工作中,我们提出了一种新的程序,旨在通过同时利用多元时间序列的空间相关性和序列相关性来重建缺失序列。该程序基于一个空间动态模型,并基于时间序列中的线性组合来插补缺失值邻居当代观察及其滞后值。它专门面向时空数据,尽管它足够通用,可以应用于通用平稳多元时间序列。本文将该方法应用于污染数据,其中序列缺失问题受到了严重关注,并取得了令人满意的性能。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62D10号 缺少数据
62H11型 定向数据;空间统计学
62页第12页 统计在环境和相关主题中的应用
62时20分 关联度量(相关性、典型相关性等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aga E、Samoli E、Touloumi G、Anderson HR、Cadum E、Forsberg B(2003)环境颗粒物对老年人死亡率的短期影响:来自APHEA2项目中28个城市的结果。Eur Resp J增刊40:28s33
[2] Anselin L(1988)《空间计量经济学:方法和模型》。多德雷赫特Kluwer学院·Zbl 1328.62406号 ·doi:10.1007/978-94-015-7799-1
[3] Biggeri A、Baccini M、Accetta G、Lagazio C(2002)《意大利空气污染物短期影响评估》。流行病学和流行性感冒26:203205
[4] Calculli C,FassóA,Finazzi F,Pollice A,Turnone A(2015)多元隐藏动态地质统计模型的最大似然估计及其在意大利阿普里亚空气质量中的应用。环境计量26:406-417·Zbl 1525.62086号 ·doi:10.1002/env.2345
[5] Cameletti M,Ignacolo R,Bande S(2011)皮埃蒙特颗粒物时空模型比较。环境计量22:985996·doi:10.1002/env.1139
[6] Dou B,Parrella ML,Yao Q(2016)未知对角系数时空模型的广义Yule-Walker估计。《经济学杂志》194:369-382·Zbl 1443.62252号 ·doi:10.1016/j.jeconom.2016.05.014
[7] Fitri MDNF、Ramli NA、Yahaya AS、Sansuddin N、Ghazali NA、Al Madhoun W(2010)PM10浓度的季风差异和概率分布。环境监测评估163:655-667·doi:10.1007/s10661-009-0866-0
[8] Honaker J,King G,Blackwell M(2011)Amelia II:缺失数据程序。J Stat Softw杂志45(7):1-47·doi:10.18637/jss.v045.i07
[9] Josse J,Husson F(2016)missMDA:处理多元数据分析中缺失值的软件包。J Stat Softw杂志70(1):1-31·doi:10.18637/jss.v070.2001
[10] Junninen H,Niska H,Tuppurrainen K,Ruuskanen J,Kolehmainen M(2004)空气质量数据集中缺失值的插补方法。Atmos Environ大气环境38:2895-2907·doi:10.1016/j.atmosenv.2004.02.026
[11] Kowarik A,Templ M(2016),R包VIM插补。J Stat Softw杂志74(7):1-16·doi:10.18637/jss.v074.i07
[12] Lee LF,Yu J(2010a)具有固定效应的空间自回归面板数据模型的估计。经济学杂志154:165-185·Zbl 1431.62643号 ·doi:10.1016/j.econom.2009.08.001
[13] Lee LF,Yu J(2010b)空间面板数据模型的一些最新发展。Reg Sci城市经济40:255-271·doi:10.1016/j.regscieurbeco.2009.09.002
[14] Liu S,Molenaar PC(2014)iVAR:使用向量自回归模型插补多元时间序列中缺失数据的程序。Behav Res方法46(4):1138-1148·doi:10.3758/s13428-014-0444-4
[15] Moritz S,Bartz-Beielstein T(2017)插补TS:R.R J 9:207-218中的时间序列缺失值插补·doi:10.32614/RJ-2017-009
[16] Norazian MN、Shukri YA、Azam RN、Al Bakri AMM(2008)使用单一插补技术估算空气污染数据中的缺失值。科学亚洲34:341-345·doi:10.2306/scienceasia1513-1874.2008.34.341
[17] Oehmcke S,Zielinski O,Kramer O(2016),多元时间序列插补中带有惩罚DTW的kNN系综。在:国际神经网络联合会议(IJCNN),IEEE
[18] Pollice A,Lasinio GJ(2009)《从复合监测网络插补和调整空气质量数据的两种方法》,《数据科学杂志》7:43-59
[19] Raaschou-Nielsen O,Andersen ZJ,Beelen R,Samoli E,Stafoggia M,Weinmayr G(2013)17个欧洲队列的空气污染和肺癌发病率:来自欧洲空气污染影响队列研究(ESCAPE)的前瞻性分析。柳叶刀Oncol 14(9):813-822·doi:10.1016/S1470-2045(13)70279-1
[20] van Buuren S,Groothuis-Oudshoorn K(2011)小鼠:R.J Stat Softw中链式方程的多元插补45(3):1-67·doi:10.18637/jss.v045.i03
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。