×

一般稀疏多类线性判别分析。 (英语) Zbl 1468.62170号

摘要:用稀疏方法对高维数据进行区分通常更有效,这种方法使用的是一小部分预测因子,而不是所有可用的预测因子。近年来,基于Fisher线性判别分析(LDA)提出了一些有效的二元类稀疏判别方法。在这些工作中,建议对多类问题进行扩展;然而,它们也有一些缺点,例如大量类的计算开销很大。我们提出了一种将二进制LDA解决方案推广为多类解决方案的方法,同时避免了现有方法的局限性。各种设置的仿真研究以及包括下一代测序数据在内的实际数据示例证实了所提方法的有效性。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学科学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahn,J。;Marron,J.S.,《歧视的最大数据堆积方向》,Biometrika,97,1,254-259,(2010)·Zbl 1182.62134号
[2] Bickel,P.J。;Levina,E.,fisher线性判别函数的一些理论。天真贝叶斯,以及当变量比观测值多得多时的一些替代方案,伯努利,10,689-1010,(2004)·Zbl 1064.62073号
[3] 蔡,T。;Liu,W.,稀疏线性判别分析的直接估计方法,J.Amer。统计师。协会,106,496,1566-1577,(2011)·Zbl 1233.62129号
[4] 坎迪斯,E。;Tao,T.,Dantzig选择器:当(p)远大于(n)时的统计估计,Ann.Statist。,35, 6, 2313-2351, (2007) ·Zbl 1139.62019号
[5] 克莱门森,L。;哈斯蒂,T。;维滕,D。;Ersböll,B.,稀疏判别分析,技术计量学,53,4,406-413,(2011)
[6] CVX Research,I.,2012年。CVX:Matlab软件,用于严格的凸编程,2.0版。http://cvxr.com/cvx。
[7] Dettling,M.,用基因表达数据进行肿瘤分类的Bagboosting,生物信息学,20,183583-3593,(2004),网址:网址:http://stat.ethz.ch/dettling/bagboost.html
[8] 医学硕士Dillies。;Rau,A。;Aubert,J。;Hennequet-Anier,C。;Jeanmougin,M。;仆人,N。;凯姆,C。;马洛特,G。;卡斯特尔,D。;埃斯特尔,J。;格内克,G。;贾格拉,B。;Jouneau,L。;拉洛·D。;加尔,C.L。;谢弗,B。;克罗姆,S.L。;Guedj,M。;Jaffrézic,F.,照明高通量RNA测序数据分析归一化方法的综合评估,简介。生物信息。,14, 6, 671-683, (2013)
[9] Fisher,R.A.,《多重测量在分类问题中的应用》,《优生学年鉴》,第7、2、179-188页,(1936年)
[10] 弗雷泽,A.C。;Langmead,B。;Leek,J.T.,Recount:分析成熟RNA-seq基因计数数据集的多实验资源,BMC生物信息学,12,449,(2011)
[11] 格兰特,M。;Boyd,S.,非光滑凸程序的图形实现,(Blondel,V.;Boyd·Zbl 1205.90223号
[12] 格雷夫利,B。;布鲁克斯,A。;卡尔森,J。;达夫,M。;兰多林,J。;Yang,L。;阿蒂埃里,C。;van Baren,M。;北卡罗来纳州博利。;布斯,B。;Brown,J。;Cherbas,L。;Davis,C。;Dobin,A。;李,R。;林,W。;马龙,J。;马蒂乌佐,N。;米勒,D。;Sturgill博士。;Tuch,B。;Zaleski,C。;张,D。;布兰切特,M。;Dudoit,S。;伊兹,B。;绿色,R。;哈蒙兹,A。;江,L。;卡普兰诺夫,P。;兰顿,L。;佩里蒙,N。;桑德勒,J。;Wan,K。;Willingham,A。;Zhang,Y。;邹,Y。;安德鲁斯,J。;比克尔,P。;Brenner,S。;布伦特,M。;Cherbas,P。;Gingeras,T。;霍斯金斯,R。;考夫曼,T。;奥利弗,B。;Celniker,S.,果蝇发育转录组,《自然》,471,473-479,(2011)
[13] 郭毅。;哈斯蒂,T。;Tibshirani,R.,正则化线性判别分析及其在微阵列中的应用,生物统计学,8,1,86-100,(2007)·Zbl 1170.62382号
[14] 哈斯蒂,T。;Tibshirani,R。;Buja,A.,通过最佳评分进行灵活的判别分析,J.Amer。统计师。协会,89,1255-1270,(1993)·Zbl 0812.62067号
[15] 徐春伟。;Lin,C.J.,《多类支持向量机方法的比较》,IEEE Trans。神经网络。,13, 2, 415-425, (2002)
[16] 李,M.H。;Ahn,J。;Jeon,Y.,《具有自适应数据堆积的HDLSS判别》,J.Comput。图表。统计人员。,22, 2, 433-451, (2013)
[17] Lee,Y。;Lin,Y。;Wahba,G.,多类别支持向量机,微阵列数据和卫星辐射数据分类的理论和应用,J.Amer。统计师。协会,99,465,67-81,(2004)·兹比尔1089.62511
[18] Mai,Q。;邹,H。;Yuan,M.,超高维稀疏判别分析的直接方法,Biometrika,99,1,29-42,(2012)·Zbl 1437.62550号
[19] Matthews,B.W.,t4噬菌体溶菌酶预测和观察二级结构的比较,Biochim。生物物理学。学报(BBA)-蛋白质结构,405,2,442-451,(1975)
[20] 乔,Z。;周,L。;Huang,J.Z.,稀疏线性判别分析及其在高维低样本量数据中的应用,IAENG Int.J.Appl。数学。,39, 1, 48-60, (2009) ·Zbl 1229.62086号
[21] 邵,J。;Wang,Y。;邓,X。;王珊,高维数据的阈值稀疏线性判别分析,Ann.Statist。,39, 2, 1241-1265, (2011) ·Zbl 1215.62062号
[22] Tibshirani,R。;桑德斯,M。;Rosset,S。;朱,J。;K.奈特(K.K.Knight),《通过融合套索实现的稀疏与平滑》,J.R.Stat.Soc.Ser。B统计方法。,67, 1, 91-108, (2005) ·Zbl 1060.62049号
[23] Witten,D.M。;Tibshirani,R.,使用fisher线性判别法进行惩罚分类,J.R.Stat.Soc.Ser。B统计方法。,73,5753-772,(2011年)·Zbl 1228.62079号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。