×

高维数据的阈值稀疏线性判别分析。 (英语) Zbl 1215.62062号

摘要:在许多社会、经济、生物学和医学研究中,一个目标是根据从受试者身上观察到的一组变量将受试者分为几个类别中的一个。由于变量的概率分布通常未知,因此使用训练样本构造分类规则。众所周知的线性判别分析(LDA)适用于用于分类的变量数量远小于训练样本大小的情况。由于技术的进步,现代统计研究经常面临变量数量远大于样本量的分类问题,LDA可能表现不佳。我们探讨了LDA性能不佳的时间和原因,并提出了一种在未知参数的稀疏条件下渐近最优的稀疏LDA。为了说明应用,我们讨论了一个基于一组7129个基因和一个大小为72的训练样本将人类癌症分为两类白血病的示例。还进行了仿真,以验证该方法的性能。

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)
92 C50 医疗应用(通用)
65C60个 统计中的计算问题(MSC2010)
2012年12月62日 参数估计量的渐近性质

软件:

风险评估
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bickel,P.J.和Levina,E.(2004)。Fisher线性判别函数的一些理论,“朴素贝叶斯”,以及当变量比观测值多时的一些替代方法。伯努利10 989-1010·Zbl 1064.62073号 ·doi:10.3150/bj/1106314847
[2] Bickel,P.J.和Levina,E.(2008)。通过阈值进行协方差正则化。安。统计师。36 2577-2604. ·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[3] Clemmensen,L.、Hastie,T.和Ersböll,B.(2008)。稀疏判别分析。技术报告,丹麦技术大学和斯坦福大学。
[4] Donoho,D.L.和Johnstone,I.M.(1994年)。通过小波收缩实现理想的空间自适应。生物特征81 425-455。JSTOR公司:·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[5] Donoho,D.L.、Johnstone,I.M.、Kerkyachian,G.和Picard,D.(1995)。小波收缩:渐近?J.罗伊。统计师。Soc.序列号。B 57 301-369。JSTOR公司:·兹比尔0827.62035
[6] Fan,J.和Fan,Y.(2008)。使用特征退火独立性规则的高维分类。安。统计师。36 2605-2637. ·Zbl 1360.62327号 ·doi:10.1214/07-AOS504
[7] Fan,J.和Lv,J.(2010)。高维特征空间中变量选择的选择性概述。统计师。Sinica 20 101-148号·Zbl 1180.62080号
[8] Fang,K.T.和Anderson,T.W.(编辑)(1990年)。椭圆轮廓分布和相关分布中的统计推断。Allerton出版社,纽约·Zbl 0747.00016号
[9] Golub,T.R.、Slonim,D.K.、Tamayo,P.、Huard,C.、Gaasenbeek,M.、Mesirov,J.P.、Coller,H.、Loh,M.L.、Downing,J.R.,Caligiuri,M.A.、Bloomfield,C.D.和Lander,E.S.(1999)。《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》286 531-537·Zbl 1047.65504号
[10] Guo,Y.、Hastie,T.和Tibshirani,R.(2007)。正则化线性判别分析及其在微阵列中的应用。生物统计学8 86-100·Zbl 1170.62382号 ·doi:10.1093/biostatistics/kxj035
[11] Kohavi,R.和John,G.H.(1997年)。特征子集选择的包装器。人工智能97 273-324·Zbl 0904.68143号 ·doi:10.1016/S0004-3702(97)00043-X
[12] 乔,Z.,周,L.和黄,J.Z.(2009)。稀疏线性判别分析在高维低样本数据中的应用。IAENG国际期刊申请。数学。39 48-60. ·Zbl 1229.62086号
[13] Zhang,Q.和Wang,H.(2010)。关于BIC在判别分析中的选择一致性。统计师。Sinica西尼卡20·Zbl 1286.62061号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。