×

费希尔讲座:回归中的降维。 (英语) Zbl 1246.62148号

摘要:本文从R.a.Fisher关于降维的早期书面评论的讨论开始,将主成分作为回归中的一种降维方法进行了重新审视,发展了几种基于模型的扩展,最后描述了回归中基于模型和无模型降维的一般方法。有人认为,主成分和相关方法的作用可能比以前看到的更广泛,对预测值进行条件调节的常见做法可能会不必要地限制回归方法的选择。

MSC公司:

62H25个 因子分析和主成分;对应分析
62J99型 线性推断、回归
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adcock,R.J.(1878)。最小二乘法问题。分析师5 53–54。
[2] Aldrich,J.(2005)。Fisher和回归。统计师。科学。20 401–417. ·Zbl 1130.62300号 ·doi:10.1214/088342305000000331
[3] Alter,O.、Brown,P.和Botstein,D.(2000)。用于全基因组表达数据处理和建模的奇异值分解。程序。国家。阿卡德。科学。美国97 10101–10106。
[4] Anderson,T.W.(1984年)。估计线性统计关系。安。统计师。12 1–45. ·Zbl 0542.62039号 ·doi:10.1214/aos/1176346390
[5] Anscombe,F.J.(1961年)。残余沉积物的检查。程序。伯克利第四交响乐团。数学。统计师。普罗巴伯。1 1–36. 加州大学出版社,伯克利·Zbl 0101.35703号
[6] Anscombe,F.J.和Tukey,J.W.(1963年)。残余沉积物的检查和分析。技术计量学5 141–160。JSTOR公司:·Zbl 0118.13903号 ·doi:10.2307/1266059
[7] Box,G.E.P.(1979)。科学建模策略的稳健性。《统计学中的稳健性》(R.Launer和G.Wilkinson编辑)201–235。纽约学术出版社·Zbl 0441.62033号
[8] Box,G.E.P.(1980)。科学建模和稳健性中的抽样和贝叶斯推断(附讨论)。J.罗伊。统计师。Soc.序列号。A 143 383–430。JSTOR公司:·Zbl 0471.62036号 ·doi:10.2307/2982063
[9] Breiman,L.(2001)。统计建模:两种文化(讨论)。统计师。科学。16 199–231. ·Zbl 1059.62505号 ·doi:10.1214/ss/1009213726
[10] Bura,E.和Cook,R.D.(2001年)。扩展切片反向回归:加权二次方检验。J.Amer。统计师。协会96 996–1003。JSTOR公司:·Zbl 1047.62035号 ·doi:10.1198/016214501753208979
[11] Bura,E.和Pfeiffer,R.M.(2003)。使用DNA微阵列数据的降维技术进行类别预测的图形方法。生物信息学19 1252–1258。
[12] Chiaromonte,F.和Martinelli,J.(2002年)。用于分析具有响应的全局基因表达数据的降维策略。数学。Biosci公司。176 123–144. ·Zbl 0999.62090号 ·doi:10.1016/S0025-5564(01)00106-7
[13] Chikuse,Y.(2003)。特殊歧管统计。统计中的课堂笔记。174 . 纽约州施普林格·Zbl 1026.62051号
[14] Christensen,R.(2001)。《高级线性建模》,第二版,纽约斯普林格出版社·Zbl 0983.62057号
[15] 库克·R·D(1986)。评估当地影响(讨论)。J.罗伊。统计师。Soc.序列号。B 48 133–169。JSTOR公司:·Zbl 0608.62041号
[16] 库克·R·D(1994)。使用降维子空间识别物理系统模型中的重要输入。程序中。物理和工程科学部分18–25。阿默尔。统计师。弗吉尼亚州亚历山大市协会。
[17] 库克·R·D(1998)。回归图形:通过图形研究回归的想法。纽约威利·Zbl 0903.62001
[18] Cook,R.D.和Ni,L.(2005)。通过逆回归进行充分降维:一种最小差异方法。J.Amer。统计师。协会100 410–428·Zbl 1117.62312号 ·doi:10.1198/01621450000001501
[19] Cook,R.D.和Weisberg,S.(1982年)。回归中的残差和影响。查普曼和霍尔,伦敦·Zbl 0564.62054号
[20] Cook,R.D.和Weisberg,S.(1994年)。回归图形简介。纽约威利·Zbl 0925.62287号
[21] 考克斯,D.R.(1968年)。关于回归分析某些方面的说明。J.罗伊。统计师。Soc.序列号。A 131 265–279。
[22] Cox,D.R.(1990)。模型在统计分析中的作用。统计师。科学。5 169–174. ·Zbl 0955.62518号 ·doi:10.1214/ss/1177012165
[23] de Leeuw,L.(2006)。通过迭代奇异值分解对二进制数据进行主成分分析。计算。统计师。数据分析。50 21–39. ·Zbl 1429.62218号
[24] Edelman,A.、Arias,T.A.和Smith,S.T.(1998)。具有正交约束的算法的几何结构。SIAM J.矩阵分析。申请。20 303–353. ·Zbl 0928.6500号 ·doi:10.1137/S089547989529290954
[25] Edgeworth,F.Y.(1884)。关于减少观测值。哲学杂志135–141。
[26] Eubank,R.L.(1988)。样条平滑和非参数回归。纽约州德克尔·Zbl 0702.62036号
[27] Fearn,T.(1983年)。在校准近红外反射率仪器时误用岭回归法。申请。统计师。32 73–79.
[28] Fisher,R.A.(1922年)。理论统计学的数学基础。菲洛斯。事务处理。罗伊。Soc.伦敦Ser。A 222 309–368。
[29] Fisher,R.A.(1924年)。降雨对Rothamsted小麦产量的影响。菲洛斯。事务处理。罗伊。Soc.伦敦Ser。B 213 89–142。
[30] Fisher,R.A.(1936年)。不确定推理。程序。美国艺术与科学学院71 245–258·Zbl 0015.36301号
[31] Fisher,R.A.(1941年)。《研究工作者的统计方法》,第8版,伦敦,奥利弗和博伊德出版社·兹比尔0063.01385
[32] 乔治,E.I.和阿曼,S.D.(1996年)。多重收缩主成分回归。统计学家45 111–124。
[33] Gould,S.J.(1981)。人类的误区。纽约诺顿。
[34] Hadi,A.S.和Ling,R.F.(1998年)。关于使用主成分回归的一些注意事项。阿默尔。统计师。52 15–19.
[35] Hawkins,D.M.和Fatti,L.P.(1984年)。使用次要主成分探索多元数据。统计学家33 325–338。
[36] Helland,I.S.(1992年)。相关成分的最大似然回归。J.罗伊。统计师。Soc.序列号。B 54 637–647。JSTOR公司:·Zbl 0774.62053号
[37] Helland,I.S.和Almöy,T.(1994)。当只有几个成分相关时,预测方法的比较。J.Amer。统计师。协会89 583–591。JSTOR公司:·Zbl 0799.62080号 ·doi:10.2307/2290861
[38] Hocking,R.R.(1976年)。线性回归中变量的分析和选择。生物统计学32 1–49。JSTOR公司:·Zbl 0328.62042号 ·doi:10.2307/2529336
[39] Hotelling,H.(1933)。将复杂统计变量分析为主成分。《教育心理学杂志》24 417-441。
[40] 霍特林,H.(1957)。新的多元统计方法与因子分析的关系。英国统计学家J。心理学10 69–79。
[41] Hwang,J.T.G.和Nettleton,D.(2003)。用数据选择成分和相关方法进行主成分回归。技术计量学45 70–79·电话:10.1198/004017002188618716
[42] 乔利夫,I.T.(1982)。关于回归中使用主成分的注释。申请。统计师。31 300–303.
[43] Jolliffe,I.T.(2002)。主成分分析,第二版,Springer,纽约·Zbl 1011.62064号 ·数字对象标识代码:10.1007/b98835
[44] Jong,J.和Kotz,S.(1999年)。关于主成分和回归分析之间的关系。阿默尔。统计师。53 349–351. JSTOR公司:·doi:10.2307/2686055
[45] Kendall,M.G.(1957年)。多元分析课程。伦敦格里芬·Zbl 0077.24208号
[46] Lehmann,E.L.(1990)。模型规范:Fisher、Neyman和后期开发的观点。统计师。科学。5 160–168. ·Zbl 0955.62516号 ·doi:10.1214/ss/1177012164
[47] Li,K.-C.(1991)。用于降维的分段逆回归(带讨论)。J.Amer。统计师。协会86 316–342。JSTOR公司:·Zbl 0742.62044号 ·doi:10.2307/2290563
[48] Li,L.和Li,H.(2004)。微阵列的降维方法及其在截尾生存数据中的应用。生物信息学20 3406–3412·Zbl 1022.68519号
[49] Maronna,R.(2005)。基于稳健尺度的主成分和正交回归。技术计量学47 264–273·doi:10.1198/004017005000000166
[50] Marx,B.D.和Smith,E.P.(1990年)。广义线性回归的主成分估计。生物特征77 23–31。JSTOR公司:·Zbl 0692.62051号 ·doi:10.1093/生物技术/77.123
[51] McCullagh,P.(2002年)。什么是统计模型?(经过讨论)。安。统计师。30 1225–1310. ·Zbl 1039.62003号 ·doi:10.1214/aos/1035844977
[52] Mosteller,F.和Tukey,J.W.(1977年)。数据分析与回归:统计学第二课程。Addison–Wesley,马萨诸塞州雷丁。
[53] Muirhead,R.J.(1982)。多元统计理论方面。纽约威利·Zbl 0556.62028号
[54] 阿曼,S.D.(1991)。多次测量的随机校准:Stein估计的应用。技术计量33 187–195。
[55] Pearson,K.(1901年)。在与空间中的点系统最接近的直线和平面上。哲学杂志(6)2 559–572。
[56] Rao,C.R.(1962年)。多元分析中判别函数和相关函数的使用。SankhyáSer。A 24 149–154·Zbl 0105.12401号
[57] Savage,L.J.(1976年)。重读R.A.Fisher(讨论)。安。统计师。4 441–500. ·Zbl 0325.62008号 ·doi:10.1214/aos/1176343456
[58] Scott,D.(1992年)。多元密度估计。纽约威利·Zbl 0850.62006号
[59] Seber,G.A.F.(1984)。多变量观察。纽约威利·Zbl 0627.62052号
[60] 斯皮尔曼,C.(1904)。“一般智力”是客观确定和衡量的。阿默尔。《心理学杂志》15 201–292。
[61] Stigler,S.M.(1973)。概率统计史研究。XXXII。拉普拉斯、费舍尔和充分性概念的发现。生物特征60 439–445。JSTOR公司:·Zbl 0286.01010号
[62] Stigler,S.M.(1976年)。讨论L.J.Savage的《关于重读R.A.Fisher》。安。统计师。4 498–500. ·Zbl 0325.62008号 ·doi:10.1214/aos/1176343456
[63] Stigler,S.M.(2005)。费希尔于1921年。统计师。科学。20 32–49. ·Zbl 1100.01511号 ·doi:10.1214/088342305000000025
[64] Tipping,M.E.和Bishop,C.M.(1999)。概率主成分分析。J.R.统计社会服务。B统计方法。61 611–622. JSTOR公司:·Zbl 0924.62068号 ·doi:10.1111/1467-9868.00196
[65] 夏毅、童宏、李维凯和朱丽霞(2002)。降维空间的自适应估计(附讨论)。J.R.统计社会服务。B统计方法。64 363–410. JSTOR公司:·Zbl 1091.62028号 ·doi:10.1111/1467-9868.03411
[66] Zhao,L.P.和Prentice,R.L.(1990)。使用二次指数模型的相关二元回归。生物特征77 642–648。JSTOR公司:·doi:10.1093/biomet/77.3.642
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。