伊琳娜·盖纳诺娃;王天英 通过线性降维稀疏二次分类规则。 (英语) Zbl 1409.62128号 《多元分析杂志》。 169, 278-299 (2019). 本文的主要贡献是基于投影判别分析(DAP)的新型二次分类器。作为高效凸优化过程的一部分,所提出的DAP方法将变量选择和原始数据在低维空间上的投影相结合。通过仿真和实际数据验证了该方法的有效性。审核人:丹尼斯·西多罗夫(伊尔库茨克) 引用于三文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 2015年1月62日 贝叶斯推断 62C12号机组 经验决策程序;经验贝叶斯程序 90C25型 凸面编程 关键词:凸优化;判别分析;高维统计;变量选择;贝叶斯规则 软件:风险评估;github;数据微阵列;处罚LDA;目的地交货;微基准;RidgeFusion公司;MGSDA公司;JGL公司 PDF格式BibTeX公司 XML格式引用 \textit{I.Gaynanova}和\textit{T.Wang},J.多元分析。169278--299(2019年;Zbl 1409.62128) 全文: 内政部 arXiv公司 链接 参考文献: [1] 巴赫,F.R.,拉索群的一致性和多核学习,J.马赫。学习。第9号决议,1179-1225,(2008年)·Zbl 1225.68147号 [2] R.F.Barber,M.Drton,线性回归的群套索和稀疏群套索中的精确分块优化,arXiv.org,2010。;R.F.Barber,M.Drton,《线性回归的群套索和稀疏群套索中的精确分块优化》,arXiv.org,2010年。 [3] 博伊德,S.P。;Vandenberghe,L.,凸优化,(2004),剑桥大学出版社:剑桥大学出版社·Zbl 1058.90049号 [4] Breheny,P。;Huang,J.,带分组预测因子的非凸惩罚线性和logistic回归模型的群下降算法,统计计算。,25, 173-187, (2015) ·Zbl 1331.62359号 [5] Cai,T.T。;Liu,W.,稀疏线性判别分析的直接估计方法,J.Amer。统计师。协会,106,1566-1577,(2011)·兹比尔1233.62129 [6] 陈海伟。;黄,H.-C。;Lin,Y.-S。;Chang,K.-J。;Kuo,W.-H。;Hwa,H.-L。;谢福杰。;Juan,H.-F.,不同种族乳腺癌雌激素受体相关基因表达谱的比较和鉴定,乳腺癌基础临床。Res.,1,35-49,(2008年) [7] Chin,K。;德弗里斯,S。;Fridlyand,J。;斯佩尔曼,P.T。;罗伊达斯古普塔,R。;Kuo,W.-L。;拉普克,A。;内夫·R·M。;钱,Z。;Ryder,T。;陈,F。;费勒,H。;德意志,T。;金斯利,C。;Dairkee,S。;孟,Z。;Chew,K。;平克尔,D。;Jain,A。;Ljung,B.M。;Esserman,L。;Albertson,D.G。;Waldman,F.M。;Gray,J.W.,《与乳腺癌病理生理相关的基因组和转录异常》,《癌细胞》,10529-541,(2006) [8] 乔达里,D。;Lathrop,J。;斯凯尔顿,J。;科廷,K。;Briggs,T。;Zhang,Y。;Yu,J。;Wang,Y。;Mazumder,A.,《预后基因表达特征可以在RNAlater防腐剂收集的组织中测量》,《分子诊断学杂志:JMD》,8,31-39,(2006) [9] 克莱门森,L。;Witten,D.M。;哈斯蒂·T·J。;Ersböll,B.,稀疏判别分析,技术计量学,53,406-413,(2011) [10] P.Danaher,JGL:对多个类别进行稀疏逆协方差估计的联合图形拉索法,2013年。R(右); P.Danaher,JGL:对多个类别进行稀疏逆协方差估计的联合图形拉索法,2013年。R(右) [11] Danaher,P。;王,P。;Witten,D.M.,《跨多类协方差逆估计的联合图形套索》,J.R.Stat.Soc.Ser。B统计方法。,76, 373-397, (2014) ·Zbl 07555455号 [12] Dudoit,S。;Fridlyand,J。;Speed,T.P.,《利用基因表达数据对肿瘤进行分类的鉴别方法比较》,J.Amer。统计师。协会,97,77-87,(2002)·Zbl 1073.62576号 [13] Friedman,J.H.,正则化判别分析,J.Amer。统计师。协会,84,165-175,(1989) [14] I.Gaynanova,MGSDA:多组稀疏判别分析,2016年。R(右); I.Gaynanova,MGSDA:多组稀疏判别分析,2016。R(右) [15] 加伊纳诺娃,I。;Booth,J.G。;Wells,M.T.,《在(p\gg N)环境中规范向量的同时稀疏估计》,J.Amer。统计师。协会,111696-706,(2016) [16] 加伊纳诺娃,I。;Booth,J.G。;Wells,M.T.,惩罚与约束广义特征值问题,计算机J。图表。统计人员。,26, 379-387, (2017) [17] 加伊纳诺娃,I。;Kolar,M.,多组稀疏判别分析中的最优变量选择,电子。J.Stat.,9,2007-2034,(2015)·Zbl 1323.62060号 [18] 格雷维尔,E。;Pierron,G。;文森特·萨洛蒙,A。;粥,N。;雷纳,V。;萨维尼奥尼,A。;De Rycke,Y。;皮尔加,J.-Y。;卢切西,C。;Reyal,F。;Fourquet,A。;罗曼·罗曼,S。;拉德瓦尼,F。;萨斯特·加劳,X。;阿塞林,B。;Delatter,O.,T1T2结节阴性乳腺癌患者的预后DNA特征,基因染色体。癌症,49,1125-1134,(2010) [19] 郭杰。;莱维纳,E。;Michaelidis,G.(Michaelidis,G.)。;Zhu,J.,多图形模型的联合估计,Biometrika,98,1-15,(2011)·Zbl 1214.62058号 [20] Holst,F.,《乳腺癌中雌激素受体α基因扩增:25年的争论》,《世界临床杂志》。Oncol.公司。,7, 160-173, (2016) [21] 霍尔斯特,F。;Stahl,P.R。;鲁伊斯,C。;O.Hellywinkel。;Jehan,Z。;Wendland,M。;勒博,A。;特拉契亚诺,L。;Al-Kuraya,K。;Jänicke,F。;Sauter,G。;Simon,R.,雌激素受体α(ESR1)基因扩增在乳腺癌中常见,《自然基因》,39,655-660,(2007) [22] 徐,D。;卡卡德,S.M。;Zhang,T.,亚高斯随机向量二次型的尾部不等式,电子。公共概率。,2012年5月17日至56日·兹比尔1309.60017 [23] Huang,J。;Breheny,P。;Ma,S.,《高维模型中群体选择的选择性综述》,统计学。科学。,27481-499,(2012年)·Zbl 1331.62347号 [24] 岩本,T。;Booser,D。;瓦莱罗,V。;Murray,J.L。;Koenig,K。;埃斯特瓦·F·J。;上野,新墨西哥州。;张杰。;Shi,W。;齐,Y。;松冈,J。;Yang,E.J。;Hortobagyi,G.N。;Hatzis,C。;Symmans,W.F。;Pusztai,L.,雌激素受体(ER)mRNA和ER相关基因在乳腺癌中的表达 [25] Kadota,T。;Shepp,L.,《鉴别两个高斯信号的最佳有限线性观测集》,IEEE Trans。通知。理论,13278-284,(1967)·Zbl 0153.48704号 [26] 科拉尔,M。;Liu,H.,高维判别分析中的最优特征选择,IEEE Trans。通知。理论,611063-1083,(2015)·Zbl 1359.62250号 [27] Kullback,S.,《信息理论在多元分析中的应用》,《数学年鉴》。统计,23,88-102,(1952)·Zbl 0047.13503号 [28] 莱恩霍姆,A.-V。;努普,A。;Ejlertsen,B。;Rudbeck,T。;延森,M.-B。;缪勒,S。;Lykkesfeldt,A.E。;拉斯穆森,B.B。;Nielsen,K.V.,ESR1基因状态与配体结合分析和免疫组织化学测定的雌激素受体蛋白水平相关,Mol.Oncol。,6, 428-436, (2012) [29] Laurent,B。;Massart,P.,通过模型选择对二次函数的自适应估计,Ann.Statist。,28, 1302-1338, (2000) ·Zbl 1105.62328号 [30] Y.Le,T.J.Hastie,稀疏二次判别分析与社区贝叶斯,arXiv.org,2014。;Y.Le,T.J.Hastie,稀疏二次判别分析和社区贝叶斯,arXiv.org,2014年。 [31] 李毅。;Ngom,A.,高维生物数据分类的非负最小二乘法,IEEE/ACM Trans。计算。生物学生物学。(TCBB),10447-456,(2013) [32] 李,Q。;邵,J.,高维数据的稀疏二次判别分析,统计学。Sinica,25,457-473,(2015)·Zbl 06503804号 [33] Lin,J.,基于香农熵的散度测量,IEEE Trans。通知。理论,37,145-151,(1991)·Zbl 0712.94004号 [34] Mai,Q。;Zou,H.,关于三种稀疏线性判别分析方法的联系和等价性的注记,Technometrics,55,243-246,(2013) [35] Mai,Q。;邹,H。;Yuan,M.,超高维稀疏判别分析的直接方法,Biometrika,99,29-42,(2012)·兹比尔1437.62550 [36] Mardia,K.V。;Kent,J.T。;Bibby,J.M.,多元分析,(1979),学术出版社:纽约学术出版社·Zbl 0432.62029号 [37] O.Mersmann,《微基准:精确计时功能》,2015年。R(右); O.Mersmann,《微基准:精确计时功能》,2015年。R(右) [38] Muirhead,R.J.,《多元统计理论的各个方面》,(1982年),威利:威利纽约·兹伯利0556.62028 [39] Niu,Y.S。;郝,N。;Dong,B.,一种新的降秩线性判别分析方法及其应用,Statist。Sinica,28,189-202,(2018)·Zbl 1382.62034号 [40] Obozinski,G。;Wainwright,M.J。;Jordan,M.I.,支持高维多元回归中的联合恢复,Ann.Statist。,39, 1-47, (2011) ·Zbl 1373.62372号 [41] B.S.Price,RidgeFusion公司:R(右)R(右); B.S.Price,RidgeFusion公司:R(右)R(右) [42] 价格,B.S。;Geyer,C.J。;Rothman,A.J.,《统计学习中的岭融合》,J.Compute。图表。统计人员。,24, 439-454, (2014) [43] J.A.Ramey,《数据微阵列:分类数据集的收集》,2016年。https://github.com/ramhiser/datamicorayhttp://ramhiser.com; J.A.Ramey,《数据微阵列:分类数据集的收集》,2016年。https://github.com/ramhiser/datamicorayhttp://ramhiser.com [44] J.A.Ramey、C.K.Stein、P.D.Young、D.M.Young,《高维正则化判别分析》,arXiv.org,2016年。;J.A.Ramey、C.K.Stein、P.D.Young、D.M.Young,《高维正则判别分析》,arXiv.org,2016年。 [45] Rukhin,A.L.,正态判别函数的广义Bayes估计,J.多元分析。,41, 154-162, (1992) ·Zbl 0745.62025号 [46] N.Simon,R.J.Tibshirani,《自适应池协方差的判别分析》,arXiv.org,2011年。;N.Simon,R.J.Tibshirani,《自适应组合协方差的判别分析》,arXiv.org,2011年。 [47] 西蒙,N。;Tibshirani,R.J.,《标准化与拉索惩罚》,Statist。中国科学院,第22期,983-1001页,(2012年)·Zbl 1257.62080号 [48] Tibshirani,R.J。;哈斯蒂·T·J。;Narasimhan,B。;Chu,G.,通过最近收缩的质心进行分类预测,并应用于DNA微阵列,统计。科学。,18, 104-117, (2003) ·Zbl 1048.62109号 [49] Tseng,P.,不可微极小化块坐标下降法的收敛性,J.Optim。理论应用。,109, 475-494, (2001) ·Zbl 1006.65062号 [50] Wainwright,M.J.,使用(ell_1)约束二次规划(Lasso)恢复高维和噪声稀疏性的夏普阈值,IEEE Trans。通知。理论,55,2183-2202,(2009)·Zbl 1367.62220号 [51] T.Wang,I.Gaynanova,DAP:通过预测的判别分析,2018年。R(右); T.Wang,I.Gaynanova,DAP:通过预测的判别分析,2018年。R(右) [52] Wickham,H.,:用于数据分析的优雅图形,(2016),Springer:Springer New York·Zbl 1397.62006年 [53] Witten,D.M。;Tibshirani,R.J.,使用Fisher线性判别法进行惩罚分类,J.R.Stat.Soc.Ser。B、 73753-772(2011)·Zbl 1228.62079号 [54] Wu,Y。;秦,Y。;朱明,高维数据的二次判别分析,统计学。Sinica,(2018),(出版中) [55] 吴,M.C。;张,L。;王,Z。;哥伦比亚特区克里斯蒂安尼。;Lin,X.,基因集/通路和基因选择重要性同时测试的稀疏线性判别分析,生物信息学,251145-1151,(2009) [56] 袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,J.R.Stat.Soc.Ser。B、 68、49-67(2006)·Zbl 1141.62030号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。