×

相关成分回归:在存在近共线性的情况下重新思考回归。 (英语) Zbl 1428.62254号

Abdi,Hervé(编辑)等人,偏最小二乘法和相关方法的新观点。基于2012年5月19日至22日在美国德克萨斯州休斯顿举行的第七届偏最小二乘(PLS)会议上的陈述。纽约州纽约市:斯普林格。Springer程序。数学。《统计》第56卷,第65-78页(2013年)。
小结:我们介绍了一种新的回归方法,称为相关成分回归(CCR),它可以提供可靠的预测,即使是近多重共线性数据。当存在大量相关预测因子和相对较小的样本量,以及涉及相对较少相关预测因子的情况时,会发生近多重共线性。CCR的不同变体适用于不同类型的回归(例如线性回归、逻辑回归、Cox回归)。我们还提出了一种逐步下降的变量选择算法,用于消除不相关的预测因子。与PLS-R和惩罚回归方法不同,CCR是尺度不变的。通过几个包含实际数据的例子说明了CCR,并将其性能与使用模拟数据的其他方法进行了比较。
关于整个系列,请参见[Zbl 1276.62007年].

MSC公司:

62H20个 关联度量(相关性、典型相关性等)
62J10型 方差和协方差分析(ANOVA)
62J12型 广义线性模型(逻辑模型)

软件:

个人签名
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] J.Magidson,“CORExpress用户指南:CORExport手册”,马萨诸塞州贝尔蒙特:统计创新公司,2011年。
[2] B.Osbourne、T.Fearn、A.Miller和S.Douglas,“近红外反射光谱法在饼干和饼干面团成分分析中的应用”,《科学与食品农业杂志》,35,99-1051984年·doi:10.1002/jsfa.2740350116
[3] L.Eriksson、E.Johansson、N.Kettaneh-Wold和S.Wold,“使用投影方法(PCA和PLS)进行多变量和巨变量数据分析简介”,《计量学》,第213-225页,1999年。
[4] N.Kraemer和A.Boulesteix,“惩罚偏最小二乘法(PPLS)”,R包,V.1.052011年8月。
[5] P.J.Brown、T.Fearn和M.Vannucci,“曲线上的贝叶斯小波回归及其在光谱校准问题中的应用”,《美国统计协会杂志》,96398-4082001年·Zbl 1022.62027 ·doi:10.1198/016214501753168118
[6] J.Magidson,“相关成分回归:可能许多特征的预测/分类方法”,《美国统计协会JSM会议录》,第4372-4386页,2010年。
[7] N.Laird和D.Oliver,“使用对数线性分析技术对截尾生存数据进行协方差分析”,《美国统计协会杂志》,第76期,第231-240页,1981年·Zbl 0473.62045号 ·网址:10.1080/01621459.1981.10477634
[8] T.R.Golub、D.K.Slonim、P.Tamayo、C.Huard、M.Gaasenbeek、J.P.Mesirov、H.Coller、M.L.Loh、J.R.Downing、M.A.Caligiuri、C.D.Bloomfield和E.S.Lander,“癌症的分子分类:基因表达监测的类别发现和预测”,《科学》,第286期,第531-537页,1999年10月·doi:10.1126/science.286.5439.531
[9] P.Bickel和E.Levina,“Fisher线性判别函数的一些理论,‘幼稚贝叶斯’和当变量比观测值更多时的一些替代方法”,Bernoulli,19989-20102004年·Zbl 1064.62073号 ·doi:10.3150/bj/1106314847
[10] J.Magidson和K.Wassmann,“代理基因在预测模型中的作用:在前列腺癌早期检测中的应用”,2010年美国统计协会JSM会议记录,生物统计学部分,第2739-2753页,2010年。
[11] P.Horst,“独立于标准的预测变量的作用”,《社会科学研究公报》,第48期,第431-4361941页。
[12] H.Lynn,“行动中的压制与困惑”,《美国统计学家》,第57期,第58-61页,2003年·数字对象标识代码:10.1198/0003130031090
[13] H.Chun和S.Keleš,“同时降维和变量选择的稀疏偏最小二乘回归”,威斯康星大学,麦迪逊,2009年·Zbl 1411.62184号
[14] H.Chun和S.Keleš,“高维数据的稀疏偏最小二乘分类”,《遗传学和分子生物学的统计应用》,2010年9月17日·Zbl 1304.92041号
[15] R.Tibshirani,“通过套索的回归收缩和选择”,《皇家统计学会期刊》B辑(方法论),第58期,第267-2881996页·Zbl 0850.62538号
[16] J.Friedman、T.Hastie和R.Tibshirani,“通过坐标下降的广义线性模型的正则化路径”,《统计软件杂志》,第33期,第1-22页,2010年。
[17] J.Friedman、T.Hastie和R.Tibshirani,“拉索和弹性网正则化广义线性模型”,1.3版,Jstatsoft.org,2010年4月25日。
[18] R.Ross、M.Galsky、H.Scher、J.Magidson、K.Wassmann、G.Lee、L.Katz、S.Subudhi、A.Anand、M.Fleisher、P.Kantoff和W.Oh,“基于全血RNA转录物的去势抵抗性前列腺癌男性预后模型:一项前瞻性研究”,《柳叶刀肿瘤学》,2012年;http://dx.doi.org/10.1016/S1470-2045(12) 70263-2中·doi:10.1016/S1470-2045(12)70263-2
[19] J.Fan、Samworth和W.Yichao,“超高维特征选择:超越线性模型”,《机器学习研究杂志》,第10期,第2013-2038页,2009年·Zbl 1235.62089号
[20] M Tenenhaus,M.、Pagès,J.、Ambroisine L.和C.Guinot,“研究享乐判断之间关系的PLS方法”,《食品质量与偏好》,第16期,第315-325页,2005年·doi:10.1016/j.foodqual.2004.05.013
[21] J.Magidson和J.Vermunt,“潜在阶级模型”,载于D.Kaplan(编辑),《社会科学定量方法学圣人手册》,第175-198页。《千橡树:圣人出版社》,2004年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。