文件Zbl 1215.62062-zbMATH Open

高维数据的阈值稀疏线性判别分析。（英语） Zbl 1215.62062号

Ann.统计。第2期第39页，第1241-1265页（2011年）.

摘要：在许多社会、经济、生物学和医学研究中，一个目标是根据从受试者身上观察到的一组变量将受试者分为几个类别中的一个。由于变量的概率分布通常未知，因此使用训练样本构造分类规则。众所周知的线性判别分析（LDA）适用于用于分类的变量数量远小于训练样本大小的情况。由于技术的进步，现代统计研究经常面临变量数量远大于样本量的分类问题，LDA可能表现不佳。我们探讨了LDA性能不佳的时间和原因，并提出了一种在未知参数的稀疏条件下渐近最优的稀疏LDA。为了说明应用，我们讨论了一个基于一组7129个基因和一个大小为72的训练样本将人类癌症分为两类白血病的示例。还进行了仿真，以验证该方法的性能。

引用于72文件

MSC公司：

62小时30分	分类和区分；聚类分析（统计方面）
92 C50	医疗应用（通用）
65C60个	统计中的计算问题（MSC2010）
2012年12月62日	参数估计量的渐近性质

关键词：

分类;高维性;误分率;常态;最优分类规则;稀疏估计

软件：

风险评估

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序 arXiv公司

参考文献：

[1]	Bickel，P.J.和Levina，E.（2004）。Fisher线性判别函数的一些理论，“朴素贝叶斯”，以及当变量比观测值多时的一些替代方法。伯努利10 989-1010·Zbl 1064.62073号 ·doi:10.3150/bj/1106314847
[2]	Bickel，P.J.和Levina，E.（2008）。通过阈值进行协方差正则化。安。统计师。36 2577-2604. ·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[3]	Clemmensen，L.、Hastie，T.和Ersböll，B.（2008）。稀疏判别分析。技术报告，丹麦技术大学和斯坦福大学。
[4]	Donoho，D.L.和Johnstone，I.M.（1994年）。通过小波收缩实现理想的空间自适应。生物特征81 425-455。JSTOR公司：·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[5]	Donoho，D.L.、Johnstone，I.M.、Kerkyachian，G.和Picard，D.（1995）。小波收缩：渐近？J.罗伊。统计师。Soc.序列号。B 57 301-369。JSTOR公司：·兹比尔0827.62035
[6]	Fan，J.和Fan，Y.（2008）。使用特征退火独立性规则的高维分类。安。统计师。36 2605-2637. ·Zbl 1360.62327号 ·doi:10.1214/07-AOS504
[7]	Fan，J.和Lv，J.（2010）。高维特征空间中变量选择的选择性概述。统计师。Sinica 20 101-148号·Zbl 1180.62080号
[8]	Fang，K.T.和Anderson，T.W.（编辑）（1990年）。椭圆轮廓分布和相关分布中的统计推断。Allerton出版社，纽约·Zbl 0747.00016号
[9]	Golub，T.R.、Slonim，D.K.、Tamayo，P.、Huard，C.、Gaasenbeek，M.、Mesirov，J.P.、Coller，H.、Loh，M.L.、Downing，J.R.，Caligiuri，M.A.、Bloomfield，C.D.和Lander，E.S.（1999）。《癌症的分子分类：通过基因表达监测进行分类发现和分类预测》，《科学》286 531-537·Zbl 1047.65504号
[10]	Guo，Y.、Hastie，T.和Tibshirani，R.（2007）。正则化线性判别分析及其在微阵列中的应用。生物统计学8 86-100·Zbl 1170.62382号 ·doi:10.1093/biostatistics/kxj035
[11]	Kohavi，R.和John，G.H.（1997年）。特征子集选择的包装器。人工智能97 273-324·Zbl 0904.68143号 ·doi:10.1016/S0004-3702（97）00043-X
[12]	乔，Z.，周，L.和黄，J.Z.（2009）。稀疏线性判别分析在高维低样本数据中的应用。IAENG国际期刊申请。数学。39 48-60. ·Zbl 1229.62086号
[13]	Zhang，Q.和Wang，H.（2010）。关于BIC在判别分析中的选择一致性。统计师。Sinica西尼卡20·Zbl 1286.62061号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文件类型(j：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

高维数据的阈值稀疏线性判别分析。（英语） Zbl 1215.62062号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

高维数据的阈值稀疏线性判别分析。 （英语） Zbl 1215.62062号

MSC公司：

关键词：

软件：

参考文献：

高维数据的阈值稀疏线性判别分析。（英语） Zbl 1215.62062号