×

高维回归中的偏最小二乘预测。 (英语) Zbl 1416.62389号

线性回归模型\[y=\mu+\beta^\top(X-\mathbb{E}(X))+\varepsilon\] 考虑,其中,\(y)是一元响应,\(X\in\mathbb{R}^p\)是随机预测向量,\(mu\)和\(beta\)是未知系数,中心误差\(varepsilon\)与\(X\)无关。假设\(y,X)\)遵循非奇异多元正态分布,并且数据\(y_i,X_i)\,\(i=1,\dots,n,\)作为\(y、X)\的独立副本出现。偏最小二乘(PLS)估计量在[R.D.库克等,J.R.Stat.Soc.,Ser。B、 统计方法。75,第5号,851–877(2013年;Zbl 1411.62137号)]使用。PLS预测的渐近行为被研究为在不同排列中(n)和(p)发散。结果表明,存在一系列回归场景,其中PLS预测因子具有(sqrt{n})收敛速度,即使(n)本质上小于(p,),并且收敛速度较慢但仍可能产生实际有用的结果。还表明,PLS预测在大量的回归中实现了最佳的渐近行为,其中许多预测因子贡献了关于响应的信息。

MSC公司:

62年5月 线性回归;混合模型
62甲12 多元分析中的估计
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abudu,S.、King,P.和Pagano,T.C.(2010年)。偏最小二乘回归在季节径流预测中的应用。J.水文学。工程师15 612-623。
[2] Biancolillo,A.、Bucci,R.、Magr,A.L.、Marg,A.D.和Marini,F.(2014)。意大利手工啤酒的多平台特性数据融合旨在认证。分析。蜂鸣器。法案820 23-31。
[3] Boulesteix,A.-L.和Strimmer,K.(2007年)。偏最小二乘法:分析高维基因组数据的通用工具。简介。生物信息。8 32-44。
[4] Bro,R.和Eeldén,L.(2009)。PLS工作。《化学杂志》23 69-71。
[5] Castejón,D.、Garca-Segura,J.M.、Escudero,R.、Herrera,a.和Cambero,M.I.(2015)。肉类分泌物的代谢组学:它在评估牛肉保存和老化方面的潜力。分析。蜂鸣器。法案901 1-11。
[6] Chun,H.和Keleš,S.(2010年)。稀疏偏最小二乘回归用于同时降维和变量选择。J.R.统计社会服务。B.Stat.方法72 3-25·Zbl 1411.62184号
[7] 库克·R·D(1994)。使用降维子空间识别物理系统模型中的重要输入。《工程与物理科学学报》18-25。阿默尔。统计人员。弗吉尼亚州亚历山大市协会。
[8] 库克·R·D(1998)。回归图形:通过图形研究回归的想法。纽约威利·Zbl 0903.62001
[9] Cook,R.D.和Forzani,L.(2017年)。大数据和偏最小二乘预测。加拿大。《统计学杂志》46 62-78·Zbl 1466.62367号
[10] Cook,R.D.和Forzani,L.(2018年)。补充“高维回归中的偏最小二乘预测”。DOI:10.1214/18-AOS1681SUPP·Zbl 1416.62389号
[11] Cook,R.D.、Forzani,L.和Rothman,A.J.(2013)。丰富的高维线性回归预测。电子。J.Stat.7 3059-3088·Zbl 1279.62140号 ·doi:10.1214/13-EJS872
[12] Cook,R.D.、Helland,I.S.和Su,Z.(2013)。包络和偏最小二乘回归。J.R.统计社会服务。B.统计方法75 851-877·Zbl 1411.62137号
[13] Cook,R.D.、Li,B.和Chiaromonte,F.(2007年)。无矩阵反演回归中的降维。生物特征94 569-584·Zbl 1135.62046号 ·doi:10.1093/biomet/asm038
[14] Cook,R.D.、Li,B.和Chiaromonte,F.(2010年)。简约有效多元线性回归的包络模型。统计师。中国20 927-960·Zbl 1259.62059号
[15] de Jong,S.(1993)。SIMPLS:偏最小二乘回归的另一种方法。化学。智力。实验室系统18 251-263。
[16] Delaigle,A.和Hall,P.(2012年)。偏最小二乘法应用于函数数据的方法和理论。统计年鉴40 322-352·Zbl 1246.62084号 ·doi:10.1214/11-AOS958
[17] Eck,D.J.和Cook,R.D.(2017年)。加权包络估计处理模型选择中的变化。生物特征104 743-749·Zbl 07072240号
[18] Frank,I.E.和Frideman,J.H.(1993年)。一些化学计量学回归工具的统计视图。技术计量学35 102-246。
[19] Garthwaite,P.H.(1994)。偏最小二乘法的解释。J.Amer。统计师。协会89 122-127·兹比尔0793.62034 ·doi:10.1080/01621459.1994.10476452
[20] Goicoechea,H.C.和Oliver,A.C.(1999)。化学分析法增强同步荧光光谱法测定血清中四环素。偏最小二乘法和混合线性分析校准的比较。分析。化学71 4361-4368。
[21] Helland,I.S.(1990年)。偏最小二乘回归和统计模型。扫描。J.Stat.17 97-114·Zbl 0713.62062号
[22] Helland,I.S.(1992年)。相关成分的最大似然回归。J.罗伊。统计师。Soc.序列号。B54 637-647·Zbl 0774.62053号 ·doi:10.1111/j.2517-6161.1992.tb01902.x
[23] Helland,I.S.(2001年)。偏最小二乘回归的一些理论方面。化学。智力。实验室系统58 97-107。
[24] Kandel,T.A.、Gislam,R.、Jörgensen,U.和Lörke,P.E.(2013)。利用近红外反射光谱和化学计量学预测芦苇金丝雀草的沼气产量及其动力学。生物资源。技术。146 282-287。
[25] Koch,C.、Posch,A.E.、Goicoechea,H.C.、Herwig,C.和Lendla,B.(2013)。通过傅里叶变换红外光谱,通过偏最小二乘回归和多元曲线分辨率,对生物过程进行多分析定量。分析。蜂鸣器。法案807 103-110。
[26] Li,W.,Cheng,Z.,Wang,Y.和Qu,H.(2013)。利用近红外光谱和化学计量学对金银花进行质量控制。《生物制药杂志》。分析72 33-39。
[27] Lobaugh,N.J.、West,R.和McIntosh,A.R.(2001)。用偏最小二乘法对事件相关电位数据的实验差异进行时空分析。心理生理38 517-530。
[28] Martens,H.和Ns,T.(1992年)。多元校准。奇切斯特·威利·Zbl 0732.62109号
[29] Ns,T.和Helland,I.s.(1993年)。回归中的相关成分。扫描。《联邦公报》第20卷第239-250页·兹比尔0788.62061
[30] Naik,P.和Tsai,C.-L.(2000年)。单指标模型的偏最小二乘估计。J.R.统计社会服务。B.统计方法62 763-771·Zbl 0957.62060号 ·doi:10.1111/1467-9868.00262
[31] Nguyen,D.V.和Roke,D.M.(2002)。使用微阵列基因表达数据通过偏最小二乘法进行肿瘤分类。生物信息学18 39-50。
[32] Nguyen,D.V.和Roke,D.M.(2004)。基于微阵列分类的偏最小二乘降维:模拟研究。计算。统计师。数据分析46 407-425·Zbl 1429.62578号 ·doi:10.1016/j.csda.2003.08.001
[33] Schwartz,R.W.、Kembhavi,A.、Harwood,D.和Davis,L.S.(2009年)。使用偏最小二乘分析的人体检测。2009年IEEE第12届计算机视觉国际会议24-31。
[34] ter Braak,C.J.F.和de Jong,S.(1998年)。偏最小二乘回归的目标函数。《化学杂志》12 41-54。
[35] Wold,S.、Martens,H.和Wold,H.(1983年)。用PLS方法解决了化学中的多元校正问题。《矩阵铅笔会议记录》(A.Ruhe和B.Kágström编辑)。数学课堂笔记973 286-293。海德堡施普林格·Zbl 0499.65065号
[36] Worsley,K.J.(1997)。PET和fMRI数据统计分析的概述和一些新进展。嗯。大脑映射。5 254-258。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。