×

多维函数主成分分析。 (英语) Zbl 1505.62097号

摘要:函数主成分分析是函数和纵向数据分析中最常用的方法之一,我们将其扩展到分析在一般维域上观察到的函数/纵向数据。我们提出的解决方案充分解决了扩展中出现的计算问题。由于局部线性平滑技术除了具有良好的理论特性外,还具有执行大规模平滑和处理不同采样方案(可能在不规则域上)的数据的能力,因此被用于进行估计。除了在平滑中采用快速傅里叶变换策略外,还采用了现代GPGPU(图形处理单元上的通用计算)架构来执行并行计算,以节省计算时间。为了解决大规模数据导致的内存不足问题,在特征分解步骤中应用了随机投影程序。我们证明了当每个样本的观测数为(n/logn)^{d/4}阶时,所提出的估计量可以实现纵向数据的经典非参数速率和函数数据的最优收敛速率。最后,通过模拟研究和台湾测量的细颗粒物(PM2.5)数据验证了该方法的性能。

MSC公司:

62-08 统计问题的计算方法
62H25个 因子分析和主成分;对应分析
62兰特 功能数据分析

软件:

作为176;楔块
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aston,J.A.,Kirch,C.:应用fmri数据估算变化点的分布。附录申请。《统计》第6卷,1906-1948年(2012年)·Zbl 1257.62072号 ·doi:10.1214/12-AOAS565
[2] Aston,J.A.、Chiou,J.M.、Evans,J.:使用功能主成分混合效应模型进行语言音高分析。J.R.统计社会服务。C 59、297-317(2010)·文件编号:10.1111/j.1467-9876.2009.00689.x
[3] Aue,A.,Norinho,D.D.,Hörmann,S.:关于平稳函数时间序列的预测。《美国统计协会期刊》110,378-392(2015)·Zbl 1373.62462号 ·doi:10.1080/01621459.2014.909317
[4] Breslaw,J.A.:使用快速傅里叶变换进行交叉验证的核估计。经济学。莱特。38, 285-289 (1992) ·Zbl 0761.62039号 ·doi:10.1016/0165-1765(92)90072-7
[5] Cesaroni,G.、Forastiere,F.、Stafoggia,M.、Andersen,Z.J.、Badaloni,C.、Beelen,R.、Caracciolo,B.、de Faire,U.、Erbel,R.,Eriksen,K.T.、Fratiglioni,L.、Galassi,C.、Hampel,R.和Heier,M.,Hennig,F.,Hilding,A.、Hoffmann,B.、Houthuijs,D.、Jöckel,K.H.、Korek,M.和Lanki,T.、Leander,K.、Magnusson,P.K.E.、Migliore、E.、Ostenson、C.G.、。,Overvad,K.,Pedersen,N.L.,JP,J.,Penell,J,Pershagen,G.,Pyko,A.,Raaschou-Nielsen,O.,Ranzi,A,答:长期暴露于环境空气污染和急性冠脉事件的发生率:前瞻性队列研究和荟萃分析,来自逃逸项目的11个欧洲队列。BMJ 348(2014)。http://www.ncbi.nlm.nih.gov/pubmed/24452269
[6] Chen,K.,Zhang,X.,Petersen,A.,Müller,H.G.:单位维数据的量化:实际功能数据分析。统计生物科学。(2015). 1-23网址:10.1007/s12561-015-9137-5·Zbl 1084.62096号
[7] Chiou,J.M.:动态函数预测和分类,及其在交通流预测中的应用。附录申请。《统计》第6卷,1588-1614页(2012年)·Zbl 1257.62090号 ·doi:10.1214/12-AOAS595
[8] Chiou,J.M.,Li,P.L.:功能聚类和识别纵向数据的子结构。J.R.统计社会服务。B 69,679-699(2007)·Zbl 07555371号 ·doi:10.1111/j.1467-9868.2007.00605.x
[9] Chiou,J.M.,Li,P.L.:通过子空间投影进行基于相关性的功能聚类。《美国统计协会期刊》103,1684-1692(2008)·Zbl 1286.62058号 ·doi:10.1198/0162145000000814
[10] Chiou,J.M.,Müller,H.G.:将危险率建模为队列生命表分析和死亡率预测的功能数据。《美国统计协会期刊》104,572-585(2009)·Zbl 06441076号 ·doi:10.1198/jasa.2009.0023
[11] Chui,C.K.,Lai,M.J.:非均匀矩形分区三角剖分上的盒样条和b样条的计算。J.近似理论应用。3, 37-62 (1987) ·Zbl 0682.41020号
[12] Conn,A.R.,Scheinberg,K.,Vicente,法律公告:一般无导数信任区域算法到一阶和二阶临界点的全局收敛性。SIAM J.Optim公司。20, 387-415 (2009) ·Zbl 1187.65062号 ·数字对象标识代码:10.1137/060673424
[13] Delaigle,A.,Hall,P.:应用于函数数据的偏最小二乘法的方法和理论。Ann.Stat.40,322-352(2012年)·Zbl 1246.62084号 ·doi:10.1214/11-AOS958
[14] Fan,J.,Gijbels,I.:局部多项式建模及其应用。查普曼和霍尔,伦敦(1996)·Zbl 0873.62037号
[15] Ferré,L.,Yao,A.:功能切片反向回归分析。统计37(6),475-488(2003)·Zbl 1032.62052号 ·doi:10.1080/023318803100112845
[16] Ferré,L.,Yao,A.:平滑函数逆回归。统计正弦。15, 665-683 (2005) ·Zbl 1086.62054号
[17] Gerthiss,J.、Goldsmith,J.,Crainiceanu,C.、Greven,S.:纵向标度函数回归及其在纤维束成像数据中的应用。生物统计14,447-461(2013)·doi:10.1093/biostatistics/kxs051
[18] Gervini,D.:检测和处理不规则采样函数数据集中的外围轨迹。附录申请。Stat.31758-1775(2009年)·Zbl 1184.62101号 ·doi:10.1214/09-AOAS257
[19] Halko,N.,Martinsson,P.,Tropp,J.:寻找具有随机性的结构:构造近似矩阵分解的概率算法。SIAM版本53217-288(2011)·Zbl 1269.65043号 ·数字对象标识代码:10.1137/090771806
[20] Hall,P.,Hosseini Nasab,M.:关于函数主成分分析的性质。J.R.统计社会服务。B 68,109-126(2006)·Zbl 1141.62048号 ·数字对象标识代码:10.1111/j.1467-9868.2005305.x
[21] Hall,P.,Wand,M.P.:关于装箱核密度估值器的准确性。J.Multiv.公司。分析。56165-184(1996)·Zbl 0863.62036号 ·doi:10.1006/jmva.1996.009
[22] Hall,P.,Müller,H.G.,Wang,J.L.:功能和纵向数据分析的主成分方法的特性。Ann.Stat.341493-1517(2006)·兹比尔1113.62073 ·doi:10.1214/0090536000000272
[23] Herdman,J.A.、Gaudin,W.P.、Perks,O.、Beckingsale,D.A.、Mallinson,A.C.、Jarvis,S.A.:通过openacc实现便携性和性能。摘自:加速器编程使用指令研讨会,第19-26页(2014年)·Zbl 1429.62224号
[24] Hoti,F.,Holmström,L.:关于装箱局部线性回归中的估计误差。J.非参数。《统计》第15卷,第625-642页(2003年)·Zbl 1054.62042号 ·网址:10.1080/10485250310001605469
[25] Hung,H.,Wu,P.,Tu,I.,Huang,S.:关于二阶张量的多线性主成分分析。《生物特征》99,569-583(2012)·Zbl 1437.62500号 ·doi:10.1093/biomet/ass019
[26] Hyndman,R.J.,Shang,H.L.:预测函数时间序列。《韩国统计学会期刊》38,199-211(2009)·Zbl 1293.62267号 ·doi:10.1016/j.jkss.2009.06.002
[27] James,G.M.、Hastie,T.J.、Suger,C.A.:稀疏功能数据的主成分模型。《生物特征》87,587-602(2000)·Zbl 0962.62056号 ·doi:10.1093/biomet/87.3587
[28] Jiang,C.R.,Aston,J.A.,Wang,J.L.:动态神经影像数据去卷积的功能方法。J.Am.Stat.Assoc.111,1-13(2016年)·doi:10.1080/01621459.2015.1060241
[29] Lai,M.J.,Wang,L.:回归的二元惩罚样条曲线。统计正弦。23, 1399-1417 (2013) ·Zbl 06202712号
[30] Leng,X.,Müller,H.G.:使用功能数据分析对时间基因表达数据进行分类。生物信息学22,68-76(2006)·doi:10.1093/bioinformatics/bti742
[31] Li,Y.,Hsing,T.:函数/纵向数据中非参数回归和主成分分析的一致收敛速度。Ann.Stat.38,3321-3351(2010年)·兹比尔1204.62067 ·doi:10.1214/10-AOS813
[32] Liu,B.,Müller,H.G.:估计稀疏观测函数样本的导数,并应用于在线拍卖动力学。《美国统计协会期刊》104,704-717(2009)·Zbl 1388.62083号 ·doi:10.198/jasa.2009.0015
[33] Lu,H.,Plataniotis,K.N.K.,Venetsanopoulos,A.N.:MPCA:张量对象的多线性主成分分析。IEEE传输。神经网络。19, 18-39 (2008) ·doi:10.1109/TNN.2007.901277
[34] Marazzi,M.,Nocedal,J.:无导数优化的楔形信赖域方法。数学。程序。91289-305(2002年)·Zbl 1049.90134号 ·doi:10.1007/s101070100264
[35] Preda,C.,Saporta,G.:随机过程的PLS回归。计算。统计数据分析。48, 149-158 (2005) ·Zbl 1429.62224号 ·doi:10.1016/j.csda.2003.10.003
[36] Raaschou-Nielsen,O.,Andersen,Z.J.,Beelen,R.,Samoli,E.,Stafoggia,M.,Weinmayr,G.,Hoffmann,B.,Fischer,P.,Nieuwenhuijsen,M.J.,Brunekreef,B.,Xun,W.W.,Katsouyanni,K.,Dimakopoulou,K.儿子,C.G.,Fratiglioni,L.、Penell,J.、Korek,M.、Pershagen,G.、Eriksen,K.T.、Sörensen,M.和Tjönneland,A.、Ellermann,T.、Eeftens,M.,Peeters,P.H.、Meliefste,K.、Wang,M.;de Mesquita,B.B.、Key,T.J.、de Hoogh,K.,Concin,H.、Nagel,G.,Vilier,A.、Grioni,S.、Krogh,V.、Tsai,M.Y.、Ricceri,F.、Sacerdote,C.、Galassi,C.、Migliore,E.、Ran Zi、A.、Cesaroni、,G.、Badaloni,C.、Forastiere,F.、Tamayo,I.、Amiano,P.、Dorronsoro,M.、Trichopoulou,A.、Bamia,C.、Vineis,P.和Hoek,G.:17个欧洲队列的空气污染和肺癌发病率:来自欧洲队列空气污染影响(逃逸)研究的前瞻性分析。柳叶刀Oncol。14(9), 813-822 (2013) ·doi:10.1016/S1470-2045(13)70279-1
[37] Rice,J.,Wu,C.:非均匀采样噪声曲线的非参数混合效应模型。生物统计学57,253-259(2001)·Zbl 1209.62061号 ·doi:10.1111/j.0006-341X.2001.00253.x
[38] Rice,J.A.,Silverman,B.W.:当数据为曲线时,非参数估计平均值和协方差结构。J.R.统计社会服务。B 53,233-243(1991)·Zbl 0800.62214号
[39] Risk,B.B.,Matteson,D.S.,Ruppert,D.,Brian,S.,Caffo,A.E.:应用于静止状态fmri的独立成分分析评估。生物统计学70,224-236(2014)·Zbl 1419.62430号 ·doi:10.1111/biom.12111
[40] Ruppert,D.,Sheather,S.J.,Wand,M.:局部最小二乘回归的有效带宽选择器。《美国统计协会期刊》90,1257-1270(1995)·Zbl 0868.62034号 ·doi:10.1080/01621459.1995.10476630
[41] Silverman,B.W.:算法AS 176:使用快速傅里叶变换估计核密度。J.R.统计社会服务。第31卷,第93-99页(1982年)·Zbl 0483.62032号
[42] Silverman,B.W.:通过选择范数平滑函数主成分分析。Ann.Stat.24,1-24(1996)·Zbl 0853.62044号 ·doi:10.1214操作系统/1033066196
[43] Stewart,J.:《基础微积分:早期先验》,第2版。布鲁克斯·科尔(Brooks Cole),贝尔蒙特(Belmont)(2012)
[44] Tian,T.S.,Huang,J.Z.,Shen,H.,Li,Z.:MEG震源重建的双向正则化方法。附录申请。统计6,1021-1046(2012)·兹比尔1254.92059 ·doi:10.1214/11-AOAS531
[45] Wand,M.P.:多元核估计的快速计算。J.计算。图表。《统计》第3卷,第433-445页(1994年)
[46] Wang,W.T.,Huang,H.C.:空间数据的正则主成分分析。J.计算。图表。统计(出版中)(2016年)
[47] Yao,F.,Müller,H.G.,Wang,J.L.:稀疏纵向数据的功能数据分析。《美国统计协会期刊》100,577-590(2005a)·Zbl 1117.62451号 ·doi:10.1198/0162145000001745
[48] Yao,F.,Müller,H.G.,Wang,J.L.:纵向数据的函数线性回归分析。Ann.Stat.332873-2903(2005年b)·Zbl 1084.62096号 ·doi:10.1214/009053605000000660
[49] Zhang,T.,Li,F.,Beckes,L.,Coan,J.A.:多学科fmri数据血液动力学响应的半参数模型。《神经影像》75,136-145(2013)·doi:10.1016/j.neuroimage.2013.02.048
[50] Zhou,L.,Pan,H.:二维函数数据的主成分分析。J.计算。图表。Stat.23,779-801(2014)·doi:10.1080/10618600.2013.827986
[51] Zhu,H.,Zhang,H.、Ibrahim,J.、Peterson,B.:扩散加权磁共振图像数据中扩散张量的统计分析(含讨论)。《美国统计协会期刊》102,1081-1110(2007)
[52] Zipunnikov,V.,Caffo,B.,Yousem,D.M.,Davatzikos,C.,Schwartz,B.S.,Crainiceanu,C.:高维大脑成像的功能主成分模型。《神经影像》58,772-784(2011年a)·doi:10.1016/j.neuroimage.2011.05.085
[53] Zipunnikov,V.,Caffo,B.,Yousem,D.M.,Davatzikos,C.,Schwartz,B.S.,Crainiceanu,C.:高维数据的多级函数主成分分析。J.计算。图表。Stat.20,852-873(2011年b)·doi:10.1198/jcgs.201.10122
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。