×

光滑函数数据B样条展开的惩罚PCA方法。 (英语) Zbl 1288.62098号

摘要:函数主成分分析(FPCA)是一种降维技术,用不相关变量解释函数数据集的依赖结构。在许多应用中,数据是一组有误差的平滑函数。在这些情况下,主成分很难解释,因为估计的权重函数具有很大的可变性,并且缺乏平滑度。解决这个问题最常见的方法是通过积分d阶导数惩罚函数的粗糙度。本文提出了基于样本曲线B样条基展开的惩罚FPCA的两种替代形式,以及一种更简单的离散罚函数,该罚函数通过求相邻B样条系数之间的平方d阶差来测量函数的粗糙度(P样条罚函数)。两种平滑FPCA方法之间的主要区别在于,第一种方法在基于B样条基的样本曲线的最小二乘逼近中使用了P样条惩罚,而第二种方法在计算主成分的算法的正交约束中引入了P样条惩罚。针对这两种平滑FPCA方法,采用Leave-on-out交叉验证来选择平滑参数。开发了一个模拟研究和一个使用化学计量学函数数据的应用程序,以测试所提出的平滑方法的性能,并将结果与非惩罚FPCA和正则FPCA进行比较。

MSC公司:

62小时25分 因子分析和主成分;对应分析
65D07年 使用样条曲线进行数值计算

软件:

fda(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Saeys,W。;De Ketelaere,B。;Darius,P.,功能数据分析在化学计量学中的潜在应用,化学计学杂志,22,335-344(2008)
[2] J.O.拉姆齐。;Silverman,B.W.,《应用功能数据分析:方法和案例研究》(2002),Springer-Verlag·Zbl 1011.62002号
[3] Deville,J.C.,《Méthodes statistiques et numériques de l’analysis harmonque》,《INSEE年鉴》,第15期,第3-101页(1974年)
[4] Dauxois,J。;Pousse,A。;Romain,Y.,向量随机函数主成分分析的渐近理论:统计推断的一些应用,多元分析杂志,12136-156(1982)·Zbl 0539.62064号
[5] 詹姆斯·G·M。;哈斯蒂·T·J。;Sugar,C.A.,稀疏功能数据的主成分模型,Biometrika,87,587-602(2000)·兹比尔0962.62056
[6] 姚,F。;穆勒,H.-G。;Wang,J.-L.,稀疏纵向数据的函数数据分析,美国统计协会杂志,100577-590(2005)·Zbl 1117.62451号
[7] 卡马乔,J。;皮科,J。;Ferrer,A.,《pca的数据理解:结构和方差信息图》,化学计量学和智能实验室系统,100,48-56(2010)
[8] Cardot,H。;费拉蒂,F。;Sarda,P.,函数线性模型,《统计与概率快报》,45,11-22(1999)·Zbl 0962.62081号
[10] Cuevas,A。;费布雷罗,M。;Fraiman,R.,《线性功能回归:固定设计和功能反应的案例》,《加拿大统计杂志》,30285-300(2002)·Zbl 1012.62039号
[11] Escabias,M。;阿奎莱拉,A.M。;Valderrama,M.J.,《函数逻辑回归的主成分估计:两种不同方法的讨论》,《非参数统计杂志》,16,365-384(2004)·Zbl 1065.62114号
[12] 穆勒,H.G。;Stadtmüller,U.,《广义泛函线性模型》,《统计年鉴》,33774-805(2005)·Zbl 1068.62048号
[13] 姚,F。;穆勒,H.G。;Wang,J.L.,纵向数据的函数线性回归分析,《统计年鉴》,332873-2903(2005)·Zbl 1084.62096号
[14] Cai,T.T。;Hall,P.,《函数线性回归预测》,《统计年鉴》,342159-2179(2006)·Zbl 1106.62036号
[15] 阿奎莱拉,A.M。;Escabias,M。;Preda,C。;Saporta,G.,《使用基展开估计函数pls回归:化学计量学数据的应用》,化学计计量学和智能实验室系统,104,289-305(2010)
[16] van der Linde,A.,变分贝叶斯函数PCA,计算统计与数据分析,53,517-533(2008)·Zbl 1452.62425号
[17] 奥卡尼亚,F.a。;阿奎莱拉,A.M。;Escabias,M.,《函数主成分分析中的计算考虑》,计算统计学,22449-465(2007)·Zbl 1196.62080号
[18] 阿奎莱拉,A.M。;古铁雷斯,R。;Valderrama,M.J.,使用B样条的随机过程PCA中估计量的近似,统计模拟和计算中的通信,25,671-690(1996)·Zbl 0937.62602号
[19] 阿奎莱拉,A.M。;Escabias,M。;Valderrama,M.J.,《不同逻辑模型与功能数据的讨论:系统性红斑狼疮的应用》,计算统计与数据分析,53,151-163(2008)·Zbl 1452.62791号
[20] Besse,P。;Ramsay,J.O.,样本功能的主成分分析,《心理测量学》,51,285-311(1986)·Zbl 0623.62048号
[21] Besse,P。;Cardot,H。;Ferraty,F.,不平衡纵向数据的同步非参数回归,计算统计与数据分析,24255-270(1997)·Zbl 0900.62199号
[22] 维维亚尼,R。;格隆,G。;Spitzer,M.,fMRI数据的功能主成分分析,人脑绘图,24109-129(2005)
[23] 卡亚诺,M。;Konishi,S.,通过正则高斯基展开的函数主成分分析及其在非平衡数据中的应用,《统计规划与推断杂志》,1392388-2398(2009)·Zbl 1160.62062号
[24] Segovia Gonzalez,医学博士。;格雷罗,F.M。;Herranz,P.,以车辆保险为例向精算学解释函数主成分分析,《保险:数学与经济学》,45,278-285(2009)·Zbl 1231.91234号
[25] 黄J.Z。;沈,H。;Buja,A.,基于惩罚秩一近似的函数主成分分析,《电子统计杂志》,2678-695(2008)·兹比尔132062097
[26] 艾尔斯,P.H.C。;马克思,B.D.,《带B样条和惩罚的柔性平滑》,《统计科学》,第11期,第89-121页(1996年)·Zbl 0955.62562号
[27] 姚,F。;Lee,T.,功能主成分分析的Penized样条模型,《皇家统计学会杂志:B辑》,68,3-25(2006)·Zbl 1141.62050号
[28] Hyvärinen,A。;Karhunen,J。;Oja,E.,《独立成分分析》(2001),威利
[29] J.O.拉姆齐。;Silverman,B.W.,功能数据分析(2005),Springer-Verlag·Zbl 1079.62006号
[30] De Boor,C.,花键实用指南(修订版)(2001年),施普林格·Zbl 0987.65015号
[31] 卡诺,H。;Nakata,H。;Martin,C.,《使用归一化均匀B样条的最佳曲线拟合和平滑:研究复杂系统的工具》,应用数学与计算,16996-128(2005)·Zbl 1121.65304号
[32] 卡诺,H。;藤冈,H。;Martin,C.F.,《带约束的最优平滑和插值样条曲线》,应用数学与计算,2181831-1844(2011)·Zbl 1252.65034号
[33] Garcáa Nieto,P.J。;马丁·托雷斯,J。;de Cos Juez,F.J。;Sánchez Lasheras,F.,《使用多元自适应回归样条和多层感知器网络评估蓝桉造纸》,应用数学与计算,219755-763(2012)
[34] 瓦尔德拉马,M.J。;奥卡尼亚,F.a。;阿奎莱拉,A.M。;Ocaña-Peinado,F.M.,用两步函数模型预测花粉浓度,生物统计学,66578-585(2010)·Zbl 1192.62254号
[35] 费拉蒂,F。;Vieu,P.,非参数函数数据分析(2006),Springer-Verlag·Zbl 1119.62046号
[36] Silverman,B.W.,《通过选择范数进行平滑函数主成分分析》,《年鉴统计》,24,1-24(1996)·兹比尔0853.62044
[37] O'Sullivan,F.,《不适定逆问题的统计观点》,《统计科学》,1505-527(1986)·Zbl 0625.62110号
[38] Ruppert,D.,为缺陷样条选择节数,计算与图形统计杂志,11735-757(2002)
[39] 艾尔斯,P.H.C。;Marx,B.D.,《样条线、节点和惩罚》,《威利跨学科评论计算统计》,2637-653(2010)
[40] 克雷文,P.A。;Wahba,G.B.,用样条函数平滑有噪声的数据:通过广义交叉验证方法估计正确的平滑度,Numeriche Mathematik,31377-403(1978)·Zbl 0377.65007号
[41] Akaike,H.,统计模型识别的新视角,IEEE自动控制汇刊,19716-723(1974)·Zbl 0314.62039号
[42] Schwarz,G.E.,估算模型的维度,《年鉴统计》,6(1978年)·Zbl 0379.62005年
[43] 柯里,I。;Derban,M.,《使用p-样条曲线的灵活平滑:统一方法》,《统计建模》,2333-349(2002)·Zbl 1195.62072号
[44] Van Trees,H.L.,《检测、估计和调制理论:第一部分》(1968),威利·Zbl 0202.18002号
[45] 巴蒂,M。;Bracken,P.,《利用递归关系计算涉及b样条的积分》,应用数学与计算,172,91-100(2006)·兹比尔1088.65019
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。