×

大(p)小(n)数据的惩罚正交分量回归。 (英语) Zbl 1326.62149号

小结:在这里,我们提出了一种针对大(p)小(n)数据的惩罚正交分量回归(POCRE)。按顺序构造正交分量,以在标准化后最大化其与响应残差的相关性。提出了一种新的惩罚框架,该框架通过经验贝叶斯阈值实现,可以有效地识别每个分量的稀疏预测因子。POCRE由于其领先稀疏主成分的顺序构造而具有计算效率。此外,这种构造还提供了其他属性,例如将高度相关的预测因子分组,并允许使用共线或近似共线预测因子。利用多变量响应,POCRE可以构造公共成分,从而建立大(p)小(n)数据的潜在变量模型。

MSC公司:

62J02型 一般非线性回归
62时20分 关联度量(相关性、典型相关性等)
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bair,E.、Hastie,T.、Paul,D.和Tibshirani,R.(2006)。监督主成分预测。,美国统计协会杂志,101 119-137·Zbl 1118.62326号 ·doi:10.1198/0162145050000000628
[2] Breiman,L.(1996)。模型选择中不稳定性和稳定性的启发式。,《统计年鉴》,24 2350-2383·Zbl 0867.62055号 ·doi:10.1214/aos/1032181158
[3] Cao,K.-A.L.、Rossouw,D.、Robert-Granie,C.和Besse,P.(2008)。集成组学数据时用于变量选择的稀疏PLS。,遗传学和分子生物学中的统计应用,7第35条·Zbl 1276.62061号
[4] Chun,H.和Keles,S.(2007年)。稀疏偏最小二乘法用于同时降维和变量选择。网址:http://www.stat.wisc.edu,/\sim-keles/Papers/SPLS_Nov07.pdf。
[5] 库克·R·D(2007)。费希尔讲座:回归中的降维。,统计科学,22 1-26·兹比尔1246.62148 ·doi:10.1214/0883423060000000682
[6] Donoho,D.L.和Johnstone,I.M.(1994年)。通过小波收缩实现理想的空间自适应。,生物特征,81 425-455·Zbl 0815.62019号 ·doi:10.1093/生物技术/81.3425
[7] Efron,B.(2004)。大规模同步假设检验:选择一个无效假设。,美国统计协会杂志,99 96-104·Zbl 1089.62502号 ·doi:10.1198/0162145000000089
[8] Garthwaite,P.H.(1994)《偏最小二乘法解释》。,美国统计协会杂志,89 122-127·Zbl 0793.62034号 ·doi:10.2307/2291207
[9] Hastie,T.、Tibshirani,R.、Eisen,M.、Alizadeh,A.、Levy,R.,Staudt,L.、Chan,W.、Botstein,D.和Brown,P.(2000)基因剃毛”是一种识别具有相似表达模式的不同基因集的方法。,基因组生物学,1 research0003.1-research0003.21。
[10] James,W.和Stein,C.(1961年)。二次损失估计。,第四届伯克利数理统计与概率研讨会论文集,1 361-379。加利福尼亚大学出版社,伯克利·Zbl 1281.62026号
[11] Johnstone,I.M.和Silverman,B.W.(2004)。干草堆中的针和稻草:可能稀疏序列的经验Bayes估计。,《统计年鉴》,321594-1649·Zbl 1047.62008年 ·数字对象标识代码:10.1214/00905360400000030
[12] Johnstone,I.M.和Silverman,B.W.(2005)。EbayesThresh:R程序用于经验Bayes阈值。,统计软件杂志,12 1-38。
[13] Kramer,R.(1998)。,定量分析的化学计量技术。马塞尔·戴克。
[14] Lan,H.、Chen,M.、Flowers,J.B.、Yandell,B.S.、Stapleton,D.S.、Mata,C.M.、Mui,E.T.、Floverss,M.T.、Schueler,K.L.、Manly,K.F.、Williams,R.W.、Kendziorski,K.和Attie,A.D.(2006年)。组合表达-性状相关性和表达-数量性状位点定位。,《公共科学图书馆·遗传学》,2 e6。
[15] Nguyen,D.V.和Roke,D.M.(2002)。使用微阵列基因表达数据通过偏最小二乘法进行肿瘤分类。,生物信息学,18 39-50。
[16] Park,T.和Casella,G.(2008)。贝叶斯套索。,美国统计协会杂志,103 681-686·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[17] Shen,H.和Huang,J.Z.(2008)。基于正则化低秩矩阵逼近的稀疏主成分分析。,多元分析杂志,99 1015-1034·Zbl 1141.62049号 ·doi:10.1016/j.jmva.2007.06.007
[18] Stewart,G.W.(1974)。,矩阵计算简介。纽约:学术出版社·Zbl 0302.65021号
[19] Tibshirani,R.(1996)。通过套索进行回归收缩和选择。,英国皇家统计学会杂志B,58 267-288·Zbl 0850.62538号
[20] Tibshirani,R.、Rosset,S.、Zhu,J.和K.奈特(2005)。通过融合套索实现简洁流畅。,英国皇家统计学会杂志B,67 91-108·Zbl 1060.62049号 ·文件编号:10.1111/j.1467-9868.2005.00490.x
[21] Wold,H.(1975)。潜在变量软建模:非线性迭代偏最小二乘法。在《概率论和统计学的观点》中,M.S.Bartlett的荣誉论文(编辑J.Gani)。伦敦:学术出版社·Zbl 0331.62058号
[22] Yuan,M.和Lin,Y.(2006)。分组变量回归中的模型选择和估计。,英国皇家统计学会杂志B,68 49-67·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[23] Zou,H.和Hastie,H.(2005年)。通过弹性网进行正则化和变量选择。,英国皇家统计学会杂志B,67 301-320·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
[24] Zou,H.、Hastie,H.和Tibshirani,R.(2006)。稀疏主成分分析。,计算与图形统计杂志,15 265-286·doi:10.1198/106186006X113430
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。