×

聚类和预测多功能时间序列。 (英语) Zbl 1498.62327号

总结:对多个国家的同质年龄别死亡率进行建模和预测,可以改进长期预测。输入联合模型的数据通常根据名义属性进行分组,例如地理区域、种族群体和社会经济状况,这些属性可能仍然包含异质性并恶化预测结果。为了解决这个问题,本文提出了一种新的聚类技术,基于功能面板数据建模来追求多功能时间序列之间的同质性。使用具有固定效果的功能面板数据模型,我们可以提取常见的功能时间序列特征。这些共同特征可以分解为两个部分:功能时间趋势和功能变化模式(功能模式)。功能时间趋势反映了跨时间的动态,而功能模式捕捉曲线内的波动。提出的聚类方法通过考虑曲线之间的变化模式和时间动态,搜索多个国家的同质年龄别死亡率。通过蒙特卡罗模拟,我们证明了所提出的聚类技术优于其他现有方法,并且能够处理特征值缓慢衰减的复杂情况。在实证数据分析中,我们发现年龄别死亡率的聚类结果可以通过地理区域、种族群体和社会经济地位的组合来解释。我们进一步表明,在预测特定年龄死亡率方面,我们的模型比几种基准方法产生了更准确的预测。

MSC公司:

62第25页 统计学在社会科学中的应用
62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
62米10 统计学中的时间序列、自相关、回归等(GARCH)
62M20型 随机过程推断和预测
62升10 功能数据分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abraham,C.、Corillon,P.A.、Matzner-Læber,E.和Molinari,N.(2003)。使用B样条的无监督曲线聚类。扫描。J.统计。30 581-595. ·Zbl 1039.91067号 ·doi:10.1111/1467-9469.00350
[2] Andrews,D.W.K.(1991)。异方差和自相关一致协方差矩阵估计。计量经济学59 817-858. ·Zbl 0732.62052号
[3] Aue,A.、Norinho,D.D.和Hörmann,S.(2015)。平稳函数时间序列的预测。J.Amer。统计师。协会。110 378-392. ·Zbl 1373.62462号 ·doi:10.1080/01621459.2014.909317
[4] BAI,J.(2009)。具有交互式固定效果的面板数据模型。计量经济学77 1229-1279. ·Zbl 1183.62196号 ·doi:10.3982/ECTA6135
[5] BOIVIN,J.和NG,S.(2006年)。更多的数据总是更好地用于因子分析吗?J.计量经济学132 169-194. ·Zbl 1337.62345号 ·doi:10.1016/j.jeconom.2005.01.027
[6] BOOTH,H.和TICKLE,L.(2008)。死亡率建模和预测:方法综述。安。演员。科学。3 3-43.
[7] Bouveyron,C.、Corme,E.和Jacques,J.(2015)。用于自行车共享系统比较分析的区分功能混合模型。附录申请。斯达。9 1726-1760. ·兹比尔1397.62511 ·doi:10.1214/15-AOAS861
[8] BOUVEYRON,C.、GIRARD,S.和SCHMID,C.(2007年)。高维数据聚类。计算。统计师。数据分析。52 502-519. ·Zbl 1452.62433号 ·doi:10.1016/j.csda.2007.02.009
[9] BOUVEYRON,C.和JACQUES,J.(2011)。特定于组的函数子空间中的时间序列的基于模型的聚类。高级数据分析。分类。5 281-300. ·Zbl 1274.62416号 ·doi:10.1007/s11634-011-0095-6
[10] CHIOU,J.-M.(2012)。动态功能预测和分类,并应用于交通流预测。附录申请。斯达。6 1588-1614. ·Zbl 1257.62090号 ·doi:10.1214/12-AOAS595
[11] CHIOU,J.-M.和LI,P.-L.(2007)。功能聚类和识别纵向数据的子结构。J.R.统计社会服务。B.统计方法。69 679-699. ·Zbl 07555371号 ·文件编号:10.1111/j.1467-9868.2007.00605.x
[12] CHIOU,J.-M.和MüLLER,H.-G.(2009)。将风险率建模为队列生命表分析和死亡率预测的功能数据。J.Amer。统计师。协会。104 572-585. ·doi:10.1198/jasa.2009.0023
[13] CRAINICEANU,C.M.和GOLDSMITH,A.J.(2010)。使用WinBUGS进行贝叶斯函数数据分析。J.统计软件。32 1-33.
[14] CRAINICEANU,C.M.、STAICU,A.-M.和DI,C.Z.(2009)。广义多水平函数回归。J.Amer。统计师。协会。104 1550-1561. ·Zbl 1205.62099号 ·doi:10.1198/jasa.2009.tm08564
[15] CURRIE,I.D.、DURBAN,M.和EILERS,P.H.C.(2004)。平滑和预测死亡率。统计模型。4 279-298. ·Zbl 1061.62171号 ·doi:10.1191/1471082X04st080oa
[16] 人类死亡率数据库(2021年)。加利福尼亚大学伯克利分校(美国)和马克斯·普朗克人口研究所(德国)。可在http://www.motality.org网站(2018年12月24日下载的数据)。
[17] DI,C.-Z.,CRAINICEANU,C.M.,CAFFO,B.S.和PUNJABI,N.M.(2009年)。多层次函数主成分分析。附录申请。斯达。3 458-488. ·Zbl 1160.62061号 ·doi:10.1214/08-AOAS206
[18] 英勇,A.R.(2009)。非线性统计模型新泽西州霍博肯威利·兹比尔1179.62090
[19] GARCíA-ESCUDERO,L.A.和GORDALIZA,A.(2005)。稳健曲线聚类的建议。J.分类22 185-201. ·Zbl 1336.62179号 ·doi:10.1007/s00357-005-0013-8
[20] GIROSI,F.和KING,G.(2008)。人口预测普林斯顿大学出版社,新泽西州普林斯顿。
[21] Gneiting,T.和Raftery,A.E.(2007年)。严格正确的评分规则、预测和评估。J.Amer。统计师。协会。102 359-378. ·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[22] GREVEN,S.、CRAINICEANU,C.、CAFFO,B.和REICH,D.(2011)。纵向功能主成分分析。函数数据分析及相关主题的最新进展(F.Ferraty编辑)。Contrib.统计。149-154. 海德堡Physica-Verlag/Springer·Zbl 1329.62334号 ·doi:10.1007/978-3-7908-2736-123
[23] HALL,P.和VIAL,C.(2006年)。评估功能数据的有限维。J.R.统计社会服务。B.统计方法。68 689-705. ·Zbl 1110.62085号 ·doi:10.1111/j.1467-9868.2006.00562.x
[24] Hansen,L.P.(1982)。广义矩估计方法的大样本性质。计量经济学50 1029-1054. ·Zbl 0502.62098号 ·doi:10.2307/1912775
[25] HŇRMANN,S.和KIDZIŃSKI,Ł。(2015). 关于希尔伯特线性模型中估计的注记。扫描。J.统计。42 43-62. ·Zbl 1364.62175号 ·doi:10.1111/sjos.12094
[26] HŇRMANN,S.,KIDZIŃSKI,Ł。和HALLIN,M.(2015)。动态功能主成分。J.R.统计社会服务。B.统计方法。77 319-348. ·Zbl 1414.62133号 ·doi:10.1111/rssb.12076
[27] HÖRMANN,S.和KOKOSZKA,P.(2012年)。功能时间序列。统计手册(T.S.Rao、S.S.Lao和C.R.Rao编辑)30 157-186。阿姆斯特丹爱思唯尔。
[28] HORVáTH,L.和KOKOSZKA,P.(2012)。函数数据推理及其应用.统计学中的斯普林格系列纽约州施普林格·Zbl 1279.62017号 ·doi:10.1007/978-1-4614-3655-3
[29] HORVáTH,L.、KOKOSZKA,P.和REEDER,R.(2013)。函数时间序列平均值的估计和两样本问题。J.R.统计社会服务。B.统计方法。75 103-122. ·Zbl 07555440号 ·文件编号:10.1111/j.1467-9868.2012.01032.x
[30] HSIAO,C.(2014)。面板数据分析,第3版。计量经济学社会专题54.剑桥大学出版社,纽约·Zbl 1320.62003年 ·doi:10.1017/CBO9781139839327
[31] Hubert,L.和Arabie,P.(1985)。比较分区。J.分类2 193-218. ·Zbl 0587.62128号
[32] HYNDMAN,R.J.(2019)。人口统计:预测死亡率、生育率、移民和人口数据。可在https://CRAN.R-project.org/package=人口统计,R包版本1.21。
[33] HYNDMAN,R.J.和ULLAH,M.S.(2007)。死亡率和生育率的稳健预测:功能数据方法。计算。统计师。数据分析。51 4942-4956. ·Zbl 1162.62434号 ·doi:10.1016/j.csda.2006.07.028
[34] HYNDMAN,R.J.和SHANG,H.L.(2009)。预测功能时间序列。J.韩国统计师。Soc公司。38 199-211. ·Zbl 1293.62267号 ·doi:10.1016/j.jkss.2009.06.002
[35] HYNDMAN,R.J.和SHANG,H.L.(2010)。功能数据的彩虹图、Bagplot和箱线图。J.计算。图表。统计师。19 29-45. ·doi:10.1198/jcgs.2009.08158
[36] HYNDMAN,R.J.和SHANG,H.L.(2021)。ftsa:功能时间序列分析。可在https://CRAN.R-project.org/package=ftsa,R软件包版本6.1。
[37] JACQUES,J.和PREDA,C.(2012年)。基于模型的功能数据聚类。20年后第届欧洲人工神经网络、计算智能和机器学习研讨会布鲁日459-464。
[38] JACQUES,J.和PREDA,C.(2014b)。功能数据聚类:一项调查。高级数据分析。分类。8 231-255. ·Zbl 1414.62018年 ·doi:10.1007/s11634-013-0158-y
[39] JACQUES,J.和PREDA,C.(2014c)。多元函数数据的基于模型的聚类。计算。统计师。数据分析。71 92-106. ·Zbl 1471.62096号 ·doi:10.1016/j.csda.2012.12.004
[40] KARHUNEN,K.(1946年)。Zur Spektraltheorie随机项目。安·阿卡德。科学。芬恩.,序列号。A I数学-物理学。1946 7. ·Zbl 0030.20103号
[41] KODINARIYA,T.M.和MAKWANA,P.R.(2013)。综述了k-means聚类中聚类数的确定。国际期刊高级研究计算。科学。管理。螺柱。1 90-95.
[42] Lee,R.D.和Carter,L.R.(1992)。美国死亡率建模和预测。J.Amer。统计师。协会。87 659-671. ·Zbl 1351.62186号
[43] 李杰(2013)。用于联合预测女性和男性死亡率和预期寿命的泊松公因子模型。大众。螺柱。67 111-126.
[44] LI,N.和LEE,R.(2005)。一组人群的相干死亡率预测:Lee-Carter方法的扩展。人口统计学42 575-594.
[45] LI,N.,LEE,R.和GERLAND,P.(2013)。将Lee Carter方法扩展到死亡率下降的年龄模式的轮换模型,以进行长期预测。人口统计学50 2037-2051.
[46] LI,Y.、WANG,N.和CARROLL,R.J.(2013)。选择功能数据中主成分的数量。J.Amer。统计师。协会。108 1284-1294. ·Zbl 1288.62102号 ·doi:10.1080/01621459.2013.788980
[47] 洛夫,M.(1955年)。概率论。基金会。随机序列D.Van Nostrand有限公司,纽约州多伦多·Zbl 0066.10903号
[48] López-Pintado,S.和Romo,J.(2009)。关于函数数据的深度概念。J.Amer。统计师。协会。104 718-734. ·Zbl 1388.62139号 ·doi:10.1198/jasa.2009.0108
[49] MacQueen,J.(1967)。多元观测值分类和分析的一些方法。程序。伯克利第五交响乐团。数学。统计师。和概率(加州伯克利., 1965/66) 281-297. 加利福尼亚大学出版社,加利福尼亚州伯克利·Zbl 0214.46201号
[50] MüLLER,H.-G.(2005)。纵向数据的功能建模和分类。扫描。J.统计。32 223-246. ·Zbl 1089.62072号 ·数字对象标识代码:10.1111/j.1467-9469.2005.00429.x
[51] NEWEY,W.K.和WEST,K.D.(1987)。一个简单的半正定异方差自相关一致协方差矩阵。计量经济学55 703-708. ·Zbl 0658.62139号 ·doi:10.2307/1913610
[52] PAMPEL,F.(2005)。预测高收入国家死亡率的性别差异:吸烟的贡献。Demagr.拆卸。物件。13 455-484. ·doi:10.4054/DemRes.2005.13.18
[53] Panaretos,V.M.和Tavakoli,S.(2013年)。函数空间中平稳时间序列的傅里叶分析。安。统计师。41 568-603. ·Zbl 1267.62094号 ·doi:10.1214/13-AOS1086
[54] POLITIS,D.N.和ROMANO,J.P.(1996年)。齐次随机场的平顶核谱密度估计。J.统计。计划。推断51 41-53. ·Zbl 0847.62080号 ·doi:10.1016/0378-3758(95)00069-0
[55] POLITIS,D.N.和ROMANO,J.P.(1999年)。无限级一般平顶核的多元密度估计。《多元分析杂志》。68 1-25. ·Zbl 0954.62042号 ·doi:10.1006/jmva.1998.1774
[56] REISS,P.T.和OGDEN,R.T.(2007)。函数主成分回归和函数偏最小二乘。J.Amer。统计师。协会。102 984-996. ·Zbl 1469.62237号 ·doi:10.1198/0162145000000527
[57] RENSHAW,A.E.和HABERMAN,S.(2003)。具有年龄特异性增强的Lee-Carter死亡率预测。保险数学。经济。33 255-272. ·Zbl 1103.91371号 ·doi:10.1016/S0167-6687(03)00138-0
[58] RICE,G.和SHANG,H.L.(2017)。平稳函数时间序列长期协方差估计的插件带宽选择过程。J.时间序列分析。38 591-609. ·Zbl 1367.62094号 ·doi:10.1111/jtsa.12229
[59] RICE,J.A.和SILVERMAN,B.W.(1991)。当数据为曲线时,非参数估计平均值和协方差结构。J.罗伊。统计师。Soc.序列号。B类53 233-243. ·Zbl 0800.62214号
[60] SERBAN,N.和JIANG,H.(2012)。多层次功能聚类分析。生物计量学68 805-814. ·Zbl 1272.62085号 ·doi:10.1111/j.1541-0420.2011.01714.x
[61] SERBAN,N.和WASSERMAN,L.(2005)。CATS:变换和平滑后的聚类。J.Amer。统计师。协会。100 990-999. ·Zbl 1117.62422号 ·doi:10.1198/0162145000001574
[62] Shang,H.L.(2016)。发达国家一群人口的死亡率和预期寿命预测:多层次功能数据方法。附录申请。斯达。10 1639-1672. ·Zbl 1391.62249号 ·doi:10.1214/16-AOAS953
[63] SHANG,H.L.(2018)。平稳函数时间序列的自举方法。统计计算。28 1-10. ·Zbl 1505.62368号 ·doi:10.1007/s11222-016-9712-8
[64] SLIMEN,Y.B.、ALLIO,S.和JACKES,J.(2018年)。功能数据的基于模型的联合聚类。神经计算291 97-108.
[65] SUGAR,C.A.和JAMES,G.M.(2003年)。查找数据集中的簇数:一种信息理论方法。J.Amer。统计师。协会。98 750-763. ·Zbl 1046.62064号 ·doi:10.1198/0162145000000666
[66] TANG,C.,SHANG,H.L.和YANG,Y.(2022)。补充“聚类和预测多功能时间序列”https://doi.org/10.1214/22-AOAS1602SUPA网站, https://doi.org/10.1214/22-AOAS1602SUPB网站
[67] TARPEY,T.和KINATEDER,K.K.J.(2003)。聚类功能数据。J.分类20 93-114. ·Zbl 1112.62327号 ·doi:10.1007/s00357-003-0007-3
[68] TSAY,R.S.和WOOD,D.(2021)。MTS:用于分析多元时间序列和估计多元波动率模型的通用工具包。可在https://CRAN.R-project.org/package=MTS,R软件包版本1.03。
[69] WARD,J.H.JR.(1963年)。分层分组以优化目标函数。J.Amer。统计师。协会。58 236-244.
[70] 怀特·H(1984)。计量经济学的渐近理论学术出版社,马萨诸塞州剑桥。
[71] Wi sh niowski,A.、Smith,P.W.、Bijak,J.、Raymer,J.和Forster,J.(2015)。贝叶斯人口预测:扩展Lee-Carter方法。人口统计学52 1035-1059.
[72] Wooldridge,J.M.(2010年)。横截面与面板数据的计量经济分析,第2版,麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1327.62009年
[73] Yao,F.、Müller,H.-G.和Wang,J.-L.(2005)。稀疏纵向数据的功能数据分析。J.Amer。统计师。协会。100 577-590 ·Zbl 1117.62451号 ·doi:10.1198/0162145000001745
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。