×

复杂和空间相关函数数据的最新发展。 (英语) Zbl 07232926号

摘要:随着大规模收集高维和高频数据,新统计模型的开发正在推进。功能数据分析通过假设数据是连续函数,例如实现连续过程(曲线)或连续随机场(曲面),以及将每条曲线或曲面视为单个观测值,提供了处理大规模复杂数据所需的统计方法。在这里,我们概述了当数据复杂且具有空间相关性时的功能数据分析。我们给出了相应函数随机变量的一阶矩和二阶矩的定义和估计。我们提出了两种主要的方法:第一种方法假设数据是函数随机场的实现,即每个观测值都是带有空间分量的曲线。我们称之为空间功能数据。第二种方法假设数据是随时间观察到的连续确定性场。在这种情况下,一个观测是一个曲面或流形,我们称之为曲面时间序列。对于这两种方法,我们描述了可用于统计分析的软件。我们还使用高分辨率风速模拟数据集提供了一个数据说明,作为两种方法的示例。函数数据方法提供了一种新的数据分析范式,其中连续过程或随机场被视为单个实体。我们认为这种方法在大数据背景下非常有价值。

MSC公司:

65Dxx日 数值近似和计算几何(主要是算法)
41轴 近似和展开
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abdulah,S.、Li,Y.、Cao,J.、Ltaief,H.、Keyes,D.E.、Genton,M.G.和Sun,Y.(2019年)。ExaGeoStatR:R中的大规模地质统计学软件包,网址:arXiv:1908.06936。
[2] Aguilera-Morillo,M.C.,Durbán,M.和Aguilera,A.M.(2017年)。具有空间相关性的函数数据预测:一种惩罚方法。随机环境研究和风险评估31,7-22。
[3] Alfeld,P.、Neamtu,M.和Schumaker,L.(1996)。使用球形样条曲线拟合球形曲面上的散射数据。计算与应用数学杂志73,5-43·Zbl 0863.65002号 ·doi:10.1016/0377-0427(96)00034-9
[4] Arnone,E.、Azzimonti,L.、Nobile,F.和Sangalli,L.M.(2019)。通过带微分正则化的回归对空间相关函数数据进行建模。多元分析杂志170,275-295。功能数据分析及相关主题专刊·Zbl 1415.62016号 ·doi:10.1016/j.jmva.2018.09.006
[5] Aston,J.A.D.、Pigoli,D.和Tavakoli,S.(2017)。随机表面非参数协方差算子的可分性测试。《统计年鉴》45,1431-1461·Zbl 1407.62147号 ·doi:10.1214/16-AOS1495
[6] Aue,A.、Norinho,D.和Hörmann,S.(2015年)。平稳函数时间序列的预测。《美国统计协会杂志》110,378-392·Zbl 1373.62462号 ·doi:10.1080/01621459.2014.909317
[7] Azzimonti,L.、Sangalli,L.M.、Secchi,P.、Domanin,M.和Nobile,F.(2015)。基于PDE惩罚的空间回归血流速度场估计。《美国统计协会杂志》110,1057-1071·Zbl 1373.62534号 ·doi:10.1080/01621459.2014.946036
[8] Baladadayuthapani,V.、Mallick,B.K.、Hong,M.Y.、Lupton,J.R.、Turner,N.D.和Carroll,R.J.(2008)。贝叶斯层次空间相关功能数据分析及其在结肠癌发生中的应用。生物统计学64,64-73·Zbl 1274.62715号 ·doi:10.1111/j.1541-0420.2007.00846.x
[9] Banerjee,S.、Carlin,B.P.和Gelfand,A.E.(2015)。空间数据的分层建模与分析。统计学和应用概率专著。135.佛罗里达州博卡拉顿:CRC出版社·Zbl 1358.62009号
[10] Bel,L.、Bar-Hen,A.、Petit,R.和Cheddadi,R.(2011年)。古生态数据的时空功能回归。《应用统计学杂志》38,695-704·Zbl 1511.62392号
[11] Bernardi,M.S.、Sangalli,L.M.、Mazza,G.和Ramsay,J.O.(2017年)。空间功能数据的惩罚回归模型,用于威尼斯省废物产生量的分析。随机环境研究和风险评估31,23-38。
[12] Bohorquez,M.、Giraldo,R.和Mateu,J.(2017)。多元函数随机场:预测和最佳抽样。随机环境研究和风险评估31,53-70。
[13] 博斯克博士(2000年)。函数空间中的线性过程:理论与应用。统计学课堂讲稿149。纽约:斯普林格·Zbl 0962.60004号
[14] Caballero,W.、Giraldo,R.和Mateu,J.(2013)。空间功能数据的通用克里金方法。随机环境研究和风险评估271553-1563。
[15] Cardot,H.、Ferraty,F.和Sarda,P.(1999)。功能线性模型。统计与概率快报45,11-22·兹比尔0962.62081 ·doi:10.1016/S0167-7152(99)00036-X
[16] Chen,K.、Zhang,X.、Petersen,A.和Müller,H.-G.(2017)。量化无限维数据:功能性数据分析。生物科学统计9582-604。
[17] Crainiceanu,C.M.、Caffe,B.S.、Luo,S.、Zipunnikov,V.M.和Punjabi,N.M.(2011年)。人口值分解,用于图像人口分析的框架。《美国统计协会杂志》106,775-790·Zbl 1229.62088号 ·doi:10.1198/jasa.2011.ap10089
[18] Cressie,N.和Wikle,C.K.(2011年)。时空数据统计。概率统计威利级数。新泽西州霍博肯:John Wiley&Sons,Inc·Zbl 1273.62017年
[19] 北卡罗来纳州克雷西(2015)。空间数据统计,修订版威利经典图书馆。纽约:John Wiley&Sons,Inc.1993年版的平装版·Zbl 1347.62005年
[20] Dassi,F.、Ettinger,B.、Perotto,S.和Sangalli,L.M.(2015)。大脑皮层表面空间回归分析的网格简化策略。应用数值数学90,111-131·Zbl 1326.62147号 ·doi:10.1016/j.apnum.2014.10.007
[21] Delicado,P.、Giraldo,R.、Comas,C.和Mateu,J.(2010年)。空间功能数据统计:最近的一些贡献。EnvironMetrics环境指标21,224-239。
[22] Diggle,P.J.和Ribeiro,P.J Jr.(2007)。基于模型的地质统计学。统计学中的斯普林格系列。纽约:斯普林格·Zbl 1132.86002号
[23] Duchamp,T.和Stuetzle,W.(2003)。曲面上的样条线平滑。《计算与图形统计学杂志》12354-381。
[24] Duchon,J.(1977年)。Sobolev空间中最小化旋转不变半范数的样条函数。多变量函数构造理论(W.Schempp和K.Zeller,eds.)85-100。柏林,海德堡:施普林格·Zbl 0342.41012号
[25] 艾尔斯,P.H.C.和马克思,B.D.(1996)。使用(B)-样条曲线和惩罚进行灵活平滑。统计科学11,89-121·Zbl 0955.62562号 ·doi:10.1214/ss/1038425655
[26] Ettinger,B.、Perotto,S.和Sangalli,L.M.(2016)。二维流形上的空间回归模型。生物特征103,71-88·兹比尔1452.62997 ·doi:10.1093/biomet/asv069
[27] Ferraty,F.和Vieu,P.(2006年)。非参数函数数据分析:理论与实践。统计学中的斯普林格系列。纽约:斯普林格·Zbl 1119.62046号
[28] Finley,A.O.、Banerjee,S.和Gelfand,A.E.(2015)。用于大型单变量和多变量点参考时空数据模型的spBayes。统计软件杂志63,1-28。
[29] Galeano,P.和Peña,D.(2019年)。数据科学、大数据和统计。测试28289-329·Zbl 1428.62021号 ·doi:10.1007/s11749-019-00651-9
[30] Genton,M.G.、Johnson,C.、Potter,K.、Stenchikov,G.和Sun,Y.(2014)。曲面箱线图。统计3,1-11。
[31] Genton,M.G.和Kleiber,W.(2015)。多元地质统计学的交叉方差函数。统计科学30,147-163·Zbl 1332.86010号 ·doi:10.1214/14-STS487
[32] Giraldo,R.、Dabo-Niang,S.和Martínez,S.(2018年)。空间大数据的统计建模:一种从功能数据分析角度的方法。统计与概率快报136126-129·Zbl 1489.62413号 ·doi:10.1016/j.spl.2018.02.025
[33] Giraldo,R.、Delicado,P.和Mateu,J.(2010年)。函数数据空间预测的连续时变克立格法:环境应用。农业、生物和环境统计杂志15,66-82·Zbl 1306.62279号 ·doi:10.1007/s13253-009-0012-z
[34] Giraldo,R.、Delicado,P.和Mateu,J.(2011年)。函数值空间数据的普通kriging。环境与生态统计18,411-426。
[35] Giraldo,R.、Delicado,P.和Mateu,J.(2012)。空间相关功能数据的层次聚类。Neerlandica统计局66,403-421。
[36] Giraldo,R.、Delicado,P.和Mateu,J.(2015)。geofd:函数值数据的空间预测。R软件包版本1.0·Zbl 1283.62005年
[37] Gneiting,T.(2013)。球面上严格和非严格正定函数。伯努利19,1327-1349·Zbl 1283.62200号 ·doi:10.3150/12-BEJSP06
[38] Goulard,M.和Voltz,M.(1993)《曲线的地质统计插值:土壤科学案例研究》,805-816。多德雷赫特:施普林格。
[39] Greco,F.、Ventrucci,M.和Castelli,E.(2018)。全球收集的空间数据的P样条平滑。空间统计27,1-17。
[40] Gromenko,O.、Kokoszka,P.、Zhu,L.和Sojka,J.(2012)。应用于电离层和磁场趋势的空间指数曲线的估计和测试。应用统计年鉴669-696·Zbl 1243.62122号 ·doi:10.1214/11-AOAS524
[41] Grujic,O.和Menafoglio,A.(2017年)。fdagstat,一个R包。R软件包版本1.0。
[42] Grujic,O.、Menafoglio,A.、Yang,G.和Caers,J.(2018年)。多元希尔伯特空间值随机场的协克里金:应用于多保真度计算机代码仿真。随机环境研究和风险评估321955-1971。
[43] 海宁,R.(2003)。空间数据分析:理论与实践。剑桥:剑桥大学出版社。
[44] Hall,P.、Fisher,N.I.和Hoffmann,B.(1994年)。关于协方差函数的非参数估计。《统计年鉴》22,2115-2134·Zbl 0828.62036号 ·doi:10.1214/aos/1176325774
[45] Hall,P.和Patil,P.(1994年)。平稳随机场自方差的非参数估计的性质。概率论和相关领域99,399-424·Zbl 0799.62102号 ·doi:10.1007/BF01199899
[46] Hörmann,S.和Kokoszka,P.(2010年)。依赖性较弱的功能数据。《统计年鉴》第38期,1845-1884年·Zbl 1189.62141号 ·doi:10.1214/09-AOS768
[47] Hörmann,S.和Kokoszka,P.(2012)。第7章-功能时间序列。《时间序列分析:方法与应用》(T.S.Rao,S.S.Rao和C.Rao编辑),《统计手册》30157-186。阿姆斯特丹:爱思唯尔·Zbl 1242.62005年
[48] Horváth,L.和Kokoszka,P.(2012)。函数数据推理及其应用。统计学中的斯普林格系列。纽约:斯普林格·Zbl 1279.62017号
[49] Horváth,L.、Kokoszka,P.和Reeder,R.(2013)。函数时间序列平均值的估计和两样本问题。英国皇家统计学会杂志,B辑,统计方法75,103-122·Zbl 07555440号
[50] Horváth,L.、Kokoszka,P.和Rice,G.(2014)。测试函数时间序列的平稳性。《计量经济学杂志》179,66-82·Zbl 1293.62186号 ·doi:10.1016/j.jeconom.2013.11.002
[51] Hyndman,R.J.和Ullah,M.S.(2007年)。死亡率和生育率的稳健预测:功能数据方法。计算统计与数据分析51,4942-4956·Zbl 1162.62434号 ·doi:10.1016/j.csda.2006.07.028
[52] Ignacolo,R.、Mateu,J.和Giraldo,R..(2014)。空气质量监测功能数据的外部漂移克里格法。随机环境研究和风险评估28,1171-1186。
[53] Jiang,H.和Serban,N.(2012年)。利用应用程序到服务的可访问性,在空间相互依赖下对随机曲线进行聚类。技术计量54,108-119。
[54] Kokoszka,P.和Reimherr,M.(2013)。确定函数自回归模型的阶数。《时间序列分析杂志》34,116-129·Zbl 1274.62600号 ·文件编号:10.1111/j.1467-9892.2012.00816.x
[55] Kokoszka,P.和Reimher,M.(2017)。功能数据分析简介。统计科学系列教材。佛罗里达州博卡拉顿:CRC出版社·Zbl 1411.62004号
[56] Lai,M.-J.和Schumaker,L.L.(2007)。三角剖分的样条函数。数学及其应用百科全书。剑桥:剑桥大学出版社·Zbl 1185.41001号
[57] Lee,D.-J.、Zhu,Z.和Toscas,P.(2015)。无线传感器网络数据的时空功能数据分析。环境计量学26354-362。
[58] Lila,E.、Aston,J.A.D.和Sangalli,L.M.(2016)。二维流形上的平滑主成分分析及其在神经成像中的应用。应用统计年鉴1854-1879·Zbl 1454.62187号 ·doi:10.1214/16-AOAS975
[59] Lila,E.、Sangalli,L.M.、Ramsay,J.和Formaggia,L.(2019年)。fdaPDE:泛函数据分析和偏微分方程;基于偏微分正则化回归的功能和空间数据的统计分析。R包版本0.1-6。
[60] Lindgren,F.、Rue,H.和Lindström,J.(2011)。高斯场和高斯-马尔可夫随机场之间的明确联系:随机偏微分方程方法。英国皇家统计学会杂志,B辑,统计方法73,423-498·Zbl 1274.62360号 ·文件编号:10.1111/j.1467-9868.2011.00777.x
[61] Liu,C.、Ray,S.和Hooker,G.(2017年)。空间相关数据的功能主成分分析。统计与计算271639-1654·Zbl 1384.62186号 ·数字对象标识代码:10.1007/s11222-016-9708-4
[62] Martínez-Hernández,I.和Genton,M.G.(2020年)。函数时间序列中的非参数趋势估计及其在年死亡率中的应用。网址:arXiv:2001.04660。
[63] Martínez-Hernández,I.、Genton,M.G.和González-Farías,G.(2019年)。基于深度的函数自回归模型稳健估计。计算统计与数据分析131,66-79·Zbl 1471.62133号
[64] Mateu,J.和Romano,E.(2017年)。空间功能统计进展。随机环境研究和风险评估31,1-6。
[65] Menafoglio,A.、Gaetani,G.和Secchi,P.(2018)。复杂域上面向对象kriging的随机域分解。随机环境研究和风险评估32,3421-3437。
[66] Menafoglio,A.、Grujic,O.和Caers,J.(2016)。功能数据的普适克里格:追踪变异分析与交叉变异分析?应用于非常规页岩中的天然气预测。空间统计15,39-55。
[67] Menafoglio,A.和Secchi,P.(2017年)。复杂和空间相关数据的统计分析:面向对象空间统计综述。《欧洲运筹学杂志》258,401-410·兹比尔1395.62299 ·doi:10.1016/j.ejor.2016.09.061
[68] Menafoglio,A.、Secchi,P.和Dalla Rosa,M.(2013)。Hilbert空间空间相关函数数据的通用kriging预测器。《电子统计杂志》7,2209-2240·兹比尔1293.62120 ·doi:10.1214/13-EJS843
[69] Morris,J.S.、Baladadayuthapani,V.、Herrick,R.C.、Sanna,P.和Gutstein,H.(2011)。使用同构功能混合模型自动分析定量图像数据,并应用于蛋白质组学数据。应用统计年鉴5894-923·Zbl 1454.62367号 ·doi:10.1214/10-AOAS407
[70] Nerini,D.、Monestiez,P.和Manté,C.(2010年)。空间功能数据的协克里金。多元分析杂志101,409-418·Zbl 1180.91215号 ·doi:10.1016/j.jmva.2009.03.005
[71] Nychka,D.、Furrer,R.、Paige,J.和Sain,S.(2017年)。字段:用于空间数据的工具。R软件包版本9.9。
[72] Pebesma,E.J.(2004)。S中的多变量地质统计学:gstat包。计算机与地球科学30,683-691。
[73] Qingguo,T.和Longsheng,C.(2010)。空间数据的B样条估计。非参数统计杂志22,197-217·Zbl 1182.62066号 ·doi:10.1080/10485250903272569
[74] R核心团队(2019)。R: 统计计算语言和环境。奥地利维也纳:R统计计算基金会。
[75] Ramsay,J.O.和Silverman,B.W.(2005)。功能数据分析,第二版,《统计学中的斯普林格系列》。纽约:斯普林格·Zbl 1079.62006号
[76] Ramsay,J.O.、Wickham,H.、Graves,S.和Hooker,G.(2018年)。fda:功能数据分析。R包版本2.4.8。
[77] Ramsay,T.(2002)。在困难区域上进行样条线平滑。英国皇家统计学会杂志,B辑64,307-319·兹比尔1067.62037 ·doi:10.1111/1467-9868.00339
[78] Rekabdarkolaee,H.M.、Krut,C.、Fuentes,M.和Reich,B.J.(2019年)。用于飓风路径数据建模的贝叶斯多元函数模型和空间变系数方法。空间统计29,351-365。
[79] Reyes,A.、Giraldo,R.和Mateu,J.(2015)。盐度曲线函数空间预测的残差克立格法。统计学理论与方法通讯44,798-809·Zbl 1325.86016号 ·doi:10.1080/03610926.2012.753087
[80] Ribeiro,P.J.Jr.和Diggle,P.J(2018)。geoR:地质统计数据分析。R包版本1.7-5.2.1。
[81] Romano,E.、Balzanella,A.和Verde,R.(2017)。空间相关功能数据的空间变异性聚类。统计与计算27,645-658·Zbl 1505.62344号 ·doi:10.1007/s11222-016-9645-2
[82] Rue,H.、Martino,S.和Chopin,N.(2009年)。利用集成嵌套拉普拉斯近似对潜在高斯模型进行近似贝叶斯推断。英国皇家统计学会杂志,B辑71,319-392·Zbl 1248.62156号 ·doi:10.1111/j.1467-9868.2008.00700.x
[83] Ruiz-Medina,M.(2011年)。空间自回归和移动平均希尔伯特过程。多元分析杂志102,292-305·Zbl 1327.62266号 ·doi:10.1016/j.jmva.2010.09.005
[84] Ruiz-Medina,M.(2012年)。高维数据的空间和时空功能统计面临的新挑战。空间统计学1,82-91。
[85] Ruiz-Medina,M.D.、Salmerón,R.和Angulo,J.M.(2007)。基于POP的ARH对角化的卡尔曼滤波(1)。计算统计与数据分析51,4994-5008·Zbl 1162.62411号 ·doi:10.1016/j.csda.2006.07.013
[86] Ruppert,D.、Wand,M.P.和Carroll,R.J.(2003)。半参数回归。剑桥统计与概率数学系列12。剑桥:剑桥大学出版社·Zbl 1038.62042号
[87] Sangalli,L.M.(2020年)。一种在复杂域上分析空间和功能数据的新方法。质量工程32181-190。
[88] 桑加利·L.M.、拉姆齐·J.O.和拉姆齐·T.O.(2013)。空间样条回归模型。英国皇家统计学会杂志,B辑75,681-703·兹比尔1411.62134 ·doi:10.1111/rssb.12009
[89] Sartori,I.和Torriani,L.(2019年)。Manifoldgstat,一个R包。R包。
[90] Schabenberger,O.和Gotway,C.A.(2005年)。空间数据分析的统计方法。统计科学系列教材。伦敦:查普曼和霍尔/CRC·Zbl 1068.6206号
[91] Schlather,M.、Malinowski,A.、Oesting,M.,Boecker,D.、Strokorb,K.、Engelke,S.、Martini,J.、Ballani,F.、Moreva,O.、Auel,J.,Menck,P.J.、Gross,S.,Ober,U.、Ribeiro,P.、Ripley,B.D.、Singleton,R.和Pfaff,B.(R核心团队)(2019年)。RandomFields:模拟和分析随机场。R包版本3.3.6。
[92] Scott-Hayward,L.A.S.、Mackenzie,M.L.、Donovan,C.R.、Walker,C.G.和Ashe,E.(2014)。复杂区域空间平滑器(CReSS)。计算与图形统计杂志23,340-360。
[93] Song,J.J.和Mallick,B.(2019年)。用于预测空间相关曲线的层次贝叶斯模型。统计53,196-209·Zbl 1415.62071号 ·doi:10.1080/02331888.2018.1547905
[94] Staicu,A.-M.、Crainiceanu,C.M.和Carroll,R.J.(2010年)。空间相关多级函数数据的快速方法。生物统计学11,177-194·兹比尔1437.62610
[95] Stein,M.L.(1999)。空间数据插值。克里金的一些理论。统计学中的斯普林格系列。纽约:斯普林格·兹比尔0924.62100
[96] Sun,Y.和Genton,M.G.(2011年)。功能箱线图。计算与图形统计杂志20,316-334。
[97] Sun,Y.和Genton,M.G.(2012年)。用于时空数据可视化和离群值检测的调整功能箱线图。EnvironMetrics环境指标23、54-64。
[98] Venables,W.N.和Ripley,B.D.(2002年)。《纽约州立大学现代应用统计学》:Springer出版社。是0-387-95457-0·Zbl 1006.62003号
[99] Wahba,G.(1981年)。球体上的样条线插值和平滑。SIAM科学与统计计算杂志2,5-16·Zbl 0537.65008号 ·doi:10.1137/090202
[100] Wang,H.和Ranalli,M.G.(2007年)。复杂区域上的低秩平滑样条。生物统计学63,209-217·Zbl 1122.62098号 ·doi:10.1111/j.1541-0420.2006.00674.x
[101] Wilhelm,M.、Dedè,L.、Sangalli,L.M.和Wilhelm(2016)。IGS:用于曲面平滑的等几何方法。应用力学与工程中的计算机方法302,70-89。北卡罗来纳州克雷西(2015)。空间数据统计,修订版威利经典图书馆。纽约:John Wiley&Sons,Inc.1993年版的平装版·Zbl 1425.65185号 ·doi:10.1016/j.cma.2015.12.028
[102] Wood,S.(2017)。广义可加模型:R导论,第二版,伦敦:查普曼和霍尔出版社·Zbl 1368.62004号
[103] Wood,S.N.(2006)。广义可加混合模型的低秩尺度变分张量积平滑。生物统计学62,1025-1036·Zbl 1116.62076号 ·doi:10.1111/j.1541-0420.2006.00574.x
[104] Wood,S.N.、Bravington,M.V.和Hedley,S.L.(2008)。肥皂膜平滑。英国皇家统计学会杂志,B辑70,931-955·兹比尔1411.65021 ·doi:10.1111/j.1467-9868.2008.00665.x
[105] Xiao,L.,Li,Y.和Ruppert,D.(2013)。快速二元(P)样条:三明治更平滑。《皇家统计学会杂志》,B辑75,577-599·Zbl 1411.62109号 ·doi:10.1111/rssb.12007
[106] Yip,C.M.A.(2018年)。中东近地表和高架风资源的统计特征和制图。阿卜杜拉国王科技大学博士论文。
[107] Yue,Y.和Speckman,P.L.(2010年)。非平稳空间高斯马尔可夫随机场。计算与图形统计杂志19,96-116。
[108] Zhang,J.、Clayton,M.K.和Townsend,P.A.(2011年)。空间图像的函数并发线性回归模型。《农业、生物和环境统计杂志》16105-130·Zbl 1306.62373号 ·doi:10.1007/s13253-010-0047-1
[109] Zhang,L.、Baladadayuthapani,V.、Zhu,H.、Baggerly,K.A.、Majewski,T.、Czerniak,B.A.和Morris,J.S.(2016)。大型空间相关功能数据集的功能CAR模型。《美国统计协会杂志》111,772-786。
[110] 周,L。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。