×

一种高维稀疏结构检测的线性分类方法。 (英语) Zbl 07241480

摘要:在这篇文章中,我们考虑在高维情况下,当预测向量的维数与样本大小在理论上发生偏差时的判别分析。重点放在类数大于2的情况下。我们首先讨论了线性判别规则在不同条件下的渐近误分类率。在实际的高维分类问题中,在类均值和公共精度矩阵上假设一定的稀疏条件是合理的。理论研究表明,在已知稀疏结构的情况下,可以构造出渐近最优的线性判别规则。基于理论结果,我们提出了一种基于估计稀疏结构构造的线性判别规则,称为检测稀疏度线性判别(LDwDS)。建立了LDwDS的渐近最优性。对LDwDS与其它现有方法进行了比较。数值研究包括综合模拟研究和两个实际数据分析。数值研究表明,在误分类率方面,LDwDS在比较中考虑的所有其他方法中具有优势。

理学硕士:

H3620小时 分类和区分;聚类分析(统计方面)
62层30 约束条件下的参数推理
62L12 序贯估计
PDF格式 BibTeX公司 XML 引用
全文: 内政部

参考文献:

[1] 安德森,T.W.,多元统计分析导论(2003),威利:威利纽约·Zbl 1039.62044
[2] 巴凯,M。;王,Z。;梅尔康,G。;希尔茨,L。;宣,J。;赵,P。;萨托雷利,V。;搜索引擎优化,J。;佩戈拉罗E。;Angelini,C.,《核膜营养不良显示转录指纹表明肌肉再生中Rb-MyoD通路中断》,Brain,129,4996-1013(2006)
[3] 比克尔,P.J。;Levina,E.,《Fisher线性判别函数的一些理论》,“NaiveBayes”,以及变量比观测值更多时的一些选择,Bernoulli,10,6989-1010(2004)·Zbl 1064.62073
[4] 伯克辛斯基,医学博士。;彼得森,R.L。;绳线,常闭式。;苏伯雷克,K.A。;布罗德,B.J。;卡斯科蒂,L。;马格安蒂,V。;雷迪,P.S。;斯特拉斯,A。;Immermann,F.,《使用外周血单个核细胞转录谱对克罗恩病和溃疡性结肠炎患者的分子分类》,分子诊断杂志。,8,1,51-61(2006年)
[5] 蔡,T。;刘伟.稀疏线性判别分析的直接估计方法,J.Amer。统计学家。协会,1064961566-1577(2012)·Zbl 1233.62129
[6] 陈杰。;陈,Z.,大模型空间模型选择的扩展贝叶斯信息准则,生物计量学,953759-771(2008)·Zbl 1437.62415
[7] 陈,Z。;蒋勇,稀疏高维多元回归模型的两阶段序贯条件选择方法,国家统计学会。数学。,2018年1月26日
[8] 克莱门森,L。;黑斯蒂,T。;维顿,D。;Ersbøll,B.,稀疏判别分析,技术计量学,53,4,406-413(2011)
[9] 范,J。;Fan,Y.利用特征退火独立规则进行高维分类,Ann.Statist。,36,6,2605-2637(2008年)·Zbl 1360.62327
[10] 范,J。;Song,R.,具有NP维数的广义线性模型的确定独立性筛选,神经网络统计。,3863567-3604(2010年)·Zbl 1206.68157
[11] 郭杰,高维线性判别分析的同步变量选择与类别融合,生物统计学,11,4,599(2010)
[12] 郭英杰。;黑斯蒂,T。;Tibshirani,R.,正则化线性判别分析及其在微阵列中的应用,生物统计学,8,1,86-100(2007)·Zbl 1170.62382
[13] Hashorva,E.,多元高斯尾的渐近性与界,J.Theoret。可能吧。,18,179-97(2005年)·Zbl 1065.60017号
[14] 哈什奥尔瓦。;Husler,J.,《多元积分的渐近性及其在记录中的应用》,Stoch。模型,18,1,41-69(2002)·Zbl 0999.60043
[15] 黑斯蒂,T。;Buja,A。;Tibshirani,R.,《惩罚判别分析》,Ann.Statist。,73-102(1995年)·Zbl 0821.62031
[16] 黑斯蒂,T。;蒂比拉尼,R。;Friedman,J.,《统计学习的要素:数据挖掘、推理和预测》(2009),Springer Science&Business Media:Springer Science&Business Media New York·Zbl 1273.62005
[17] 罗,S。;陈,Z.,稀疏高斯图形模型中的边缘检测,计算机。统计学家。数据分析。,70138-152(2014年)·Zbl 1471.62128号
[18] 罗,S。;陈,Z.,超高维特征空间特征选择的序贯套索和EBIC,J.Amer。统计学家。协会,第109、507、1229-1240页(2014年)·Zbl 1368.62205
[19] 马格努斯,J.R。;Neudecker,H.,矩阵微分学及其在统计学和计量经济学中的应用(2019年),John Wiley&Sons:John Wiley&Sons New York·Zbl 1411.15003号
[20] 麦,Q。;杨,Y。;邹,H.,多类稀疏判别分析,统计学。中国(2017)
[21] 麦,Q。;邹,H。;袁,M.,超高维稀疏判别分析的直接方法,生物计量学,99,1,29-42(2012)·兹布1437.62550
[22] 盘面,右侧。;王,H。;李荣,等,超高维多类线性判别分析的成对确定独立性筛选,J.Amer。统计学家。协会,111,513,169-179(2016年)
[23] 邵杰。;王,Y。;邓,X。;王国生,高维数据阈值稀疏线性判别分析,人工神经网络,统计学。,391241-1265(2011年)·Zbl 1215.62062
[24] 蒂比拉尼,R。;黑斯蒂,T。;纳拉辛汉,B。;Chu,G.,最近收缩质心的类预测,在DNA微阵列中的应用,统计学。科学。,18,1104-117(2003年)·Zbl 1048.62109
[25] 新界特伦达菲洛夫。;Jolliffe,I.T.,DALASS:通过套索进行判别分析中的变量选择,计算机。统计学家。数据分析。,5183718-3736(2007年)·Zbl 1161.62379
[26] 王,S。;Zhu,J.,最近收缩质心分类器的改进质心估计,生物信息学,23,8,972-979(2007)
[27] 维顿博士。;Tibshirani,R.,高维问题的协方差正则化回归与分类,J.R.Stat.Soc.Ser。统计方法。,713615-636(2009年)·Zbl 1250.62033
[28] 维顿博士。;Tibshirani,R.,使用Fisher线性判别式的惩罚分类,J.R.Stat.Soc.Ser。统计方法。,735753-772(2011年)·Zbl 1228.62079
[29] 吴先生。;张,L。;王,Z。;克里斯蒂安尼,哥伦比亚特区。;Lin,X.,基因集/通路和基因选择显著性同步检测的稀疏线性判别分析,生物信息学,25,9,1145-1151(2009)
[30] 徐,P。;朱杰。;朱,L。;Li,Y.,协方差增强判别分析,生物计量学,102,1,33-45(2015)·Zbl 1345.62091
[31] 周,S。;吕蒂曼,P。;徐,男。;Bühlmann,P.,基于高斯图形模型的高维协方差估计,J.Mach。学习。Res.,12号,10月2975-3026(2011年)·Zbl 1280.62065
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。