×

从统计模型中寻找相关信息。 (英语) Zbl 1353.62070号

摘要:我们在这里介绍了一个通用的变量选择过程,它可以应用于几个参数多元问题,包括主成分和回归等。其目的是允许识别原始变量的一小部分,以便通过非参数关系“更好地解释”模型。该方法通常会产生一些有噪声的无信息变量和一些因其一般相关性而密切相关的变量,我们的目的是帮助理解给定数据集中的底层结构。文中考虑了该方法的渐近性,并以实际数据和模拟数据为例进行了分析。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H25个 因子分析和主成分;对应分析
6220国集团 非参数推理的渐近性质
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] J.C.Bezdek,模糊目标函数算法的模式识别。纽约Plenum出版社(1981年)·Zbl 0503.68069号
[2] J.Dauxois、A.Pousse和Y.Romain,向量随机函数主成分分析的渐近理论:统计推断的一些应用。《多变量分析杂志》12(1982)136-154·Zbl 0539.62064号 ·doi:10.1016/0047-259X(82)90088-4
[3] K.A.De Jong和W.M.Spears,使用遗传算法解决NP完全问题。程序中。第三届国际遗传算法会议。J.D.Schaffer(1989)124-132编辑。
[4] B.Efron,T.Hastie,I.Johnstone和R.Tibshirani,最小角度回归。通过讨论,以及作者的反驳。Ann.Stat.32(2004)407-499·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[5] J.Fan和R.Li,通过非冲突惩罚似然选择变量及其预言性质。《美国统计协会期刊》第96卷(2001年)第1348-1361页·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[6] R.Fraiman、A.Justel和M.Svarc,聚类分析和分类规则的变量选择。《美国统计协会期刊》103(2008)1294-1303·Zbl 1205.62077号 ·doi:10.1198/0162145000000544
[7] C.Fraley和A.E.Raftery,基于模型的聚类、判别分析和密度估计。《美国统计协会期刊》97(2002)611-631·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[8] C.Fraley和A.E.Raftery,《MCLUST第3版R:正态混合建模和基于模型的聚类》,华盛顿大学统计系第504号技术报告(2009年)。
[9] Y.Gimenez,Selección de variables para datos multi-variado Y para dato functionales,《变量分段数据多变量分段数据函数》。博士论文(2015)。可在
[10] B.E.Hansen,相依数据核估计的一致收敛速度。计量经济学理论24(2008)726-748·Zbl 1284.62252号 ·doi:10.1017/S0266466608080304
[11] W.K.Härdle和L.Simar,应用多元统计分析。Springer Verlag,柏林(2007)·Zbl 1115.62057号
[12] T.Hastie、R.Tibshirani和J.Friedman,《统计学习的要素》。数据挖掘、推理和预测。Springer Verlag,柏林(2001)·Zbl 0973.62007号
[13] X.He和P.Shi,部分线性模型中的二元张量积B样条。《多变量分析杂志》58(1996)162-181·Zbl 0865.62027号 ·文件编号:10.1006/jmva.1996.0045
[14] J.Hoeting、A.E.Raftrey和D.Madigan,线性回归中的贝叶斯变量和变换选择。J.计算。图表。统计11(2002)485-507·doi:10.1198/106186002501
[15] I.T.Jolliffe,主成分分析,第2版。Springer Verlag,柏林(2002)·Zbl 1011.62064号
[16] R.Li,and G.Gong,K-NN回归函数在不相关变量存在下的非参数估计。经济。J.11(1987)396-408·Zbl 1141.91641号 ·doi:10.1111/j.1368-423X.2008.00238.x
[17] R.A.Marona、D.R.Martin和V.Y.Yohai,稳健统计。理论和方法。威利(2006)。
[18] G.P.McCabe,主要变量。《技术计量学》26(1984)137-144·Zbl 0548.62037号 ·doi:10.1080/00401706.1984.10487939
[19] G.A.F.Seber和A.J.Lee,线性回归分析,第二版。《概率统计中的威利级数》(2005)·Zbl 1029.62059号
[20] L.J.Snell,当代概率及其应用专题。CRC出版社(1995)·Zbl 0849.00030号
[21] R.Tibshirani,通过套索进行回归收缩和选择。J.R.统计社会服务。B58(1996)267-288·Zbl 0850.62538号
[22] D.M.Witten和R.Tibshirani,通过套索主成分测试特征的重要性。附录申请。统计2(2008)986-1012·Zbl 1149.62092号 ·doi:10.1214/08-AOAS182
[23] D.M.Witten和R.Tibshirani,《聚类中特征选择的框架》,《美国统计协会期刊》105(2010)713-726·Zbl 1392.62194号 ·doi:10.1198/jasa.2010.tm09415
[24] D.M.Witten、R.Tibshirani和T.Hastie,惩罚矩阵分解,应用于稀疏主成分和典型相关分析。《生物统计》10(2009)515-534·doi:10.1093/biostatistics/kxp008
[25] 张C.H.,极小极大凹罚下的几乎无偏变量选择。Ann.Stat.38(2010)894-942·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[26] H.Zou、T.Hastie和R.Tibshirani,稀疏主成分分析。J.计算。图表。统计数据15(2006)265-286·doi:10.1198/106186006X113430
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。