×

基于DC编程的稳健特征选择和SVM分类的双重正则化方法。 (英语) Zbl 1436.68310号

摘要:在这项工作中,提出了两种新的嵌入特征选择公式。通过添加第二个正则化子来鼓励特征消除,扩展了支持向量机的二阶锥规划方法。在一个稳健的设置下,将一阶和零阶惩罚与Tikhonov正则化结合使用,该设置旨在正确分类实例,达到预定义的错误率,即使是对于最差的数据分布也是如此。零范数的使用导致了一个非凸公式,该公式通过使用凸差(DC)函数进行求解,将DC规划扩展到二阶锥。在高维微阵列数据集上进行了实验,与众所周知的支持向量机特征选择方法相比,我们的方法获得了最佳性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
90C22型 半定规划

软件:

塞杜米
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alizadeh,A。;艾森,M。;Davis,R。;等,通过基因表达谱确定的弥漫性大b细胞淋巴瘤的不同类型,《自然》,403,503-511(2000)
[2] Alizadeh,F。;Goldfarb,D.,二阶锥规划,数学规划,95,3-51(2003)·Zbl 1153.90522号
[3] 阿龙,美国。;北巴尔凯。;诺特曼,D。;吉什,K。;伊巴拉,S。;麦克,D。;Levine,A.,通过寡核苷酸阵列探测肿瘤和正常结肠组织的聚类分析揭示的广泛基因表达模式,《美国国家科学院院刊》,96,12,6745-6750(1999)
[4] 阿尔瓦雷斯,F。;López,J。;Ramírez C.,H.,《二阶锥规划的变尺度内点近似算法:在结构优化和支持向量机中的应用》,优化方法软件,25,6,859-881(2010)·Zbl 1226.90041号
[5] Bhattacharyya,C.,特征选择的二阶锥规划公式,机器学习研究杂志,51417-1433(2004)·Zbl 1222.68147号
[6] 布拉德利,P。;Mangasarian,O.,特征选择va凹极小化和支持向量机,第十五届国际会议(ICML'98)机器学习会议记录,82-90,加利福尼亚州旧金山,Morgan Kaufmann(1998)
[7] 卡拉斯科,M。;López,J。;Maldonado,S.,基于l1-范数最小化简化凸壳之间距离的多类svm方法,模式识别,48,5,1598-1607(2015)·Zbl 1374.68367号
[8] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,273-297(1995)·Zbl 0831.68098号
[9] Demšar,J.,多数据集分类器的统计比较,机器学习研究杂志,7,1-30(2006)·兹比尔1222.68184
[10] Dinh,T.P。;Souad,E.,求解一类非凸优化问题的算法。次梯度方法,(Hiriart-Urruti,J.-B.,Fermat Days 85:最优化数学。Fermat Dys 85:优化数学,北荷兰德数学研究,129(1986),北荷兰),249-271·Zbl 0638.90087号
[11] Dinh,T.P。;Thi,H.L.,《dc编程的凸分析方法:理论、算法和应用》,越南数学学报,22,1,287-367(1997)
[12] Dinh,T.P。;Thi,H.L.,解决信任区域子问题的直流优化算法,SIAM优化杂志,8,2,476-505(1998)·Zbl 0913.65054号
[13] 杜达,R。;硬,P。;Stork,D.,模式分类(2001),Wiley-国际科学出版物·兹伯利0968.68140
[14] 格雷维尔,E。;Pierron,G。;文森特·萨洛蒙,A。;粥,N。;雷纳,V。;萨维尼奥尼,A。;德雷克,Y。;皮尔加,J.-Y。;卢切西,C。;Reyal,F。;Fourquet,A。;罗曼·罗曼,S。;拉德瓦尼,F。;萨斯特雷·加劳,X。;Asselain,O.,t1t2结节阴性乳腺癌患者的预后dna特征,《基因、染色体与癌症》,49,12,1125(2010)
[15] 盖恩,I。;Elisseeff,A.,《变量和特征选择简介》,《机器学习研究杂志》,31157-1182(2003)·Zbl 1102.68556号
[16] 盖恩,I。;Gunn,S。;Nikravesh,M。;Zadeh,L.A.,《特征提取、基础和应用》(2006),柏林斯普林格
[17] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择。,机器学习,46,1-3,389-422(2002)·Zbl 0998.68111号
[18] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习要素》(2009),施普林格出版社·兹比尔1273.62005
[19] Krstajic,D。;Buturovic,L。;莱希,D。;Thomas,S.,《选择和评估回归和分类模型时的交叉验证陷阱》,《化学信息学杂志》,6,10,1-15(2014)
[20] 柳叶刀,G。;Ghaoui,L。;巴塔查里亚,C。;Jordan,M.,《稳健的极小极大分类方法》,《机器学习研究杂志》,3555-582(2003)·Zbl 1084.68657号
[21] López,J。;Maldonado,S.,多类二阶锥规划支持向量机的稳健特征选择,智能数据分析。,19、S1、S117-S133(2015)
[22] López,J。;Maldonado,S.,《多类二阶锥编程支持向量机》,信息科学,330,328-341(2016)·Zbl 06871048号
[23] 马尔多纳多,S。;López,J.,支持向量分类的替代二阶锥规划公式,信息科学,268328-341(2014)·Zbl 1341.68164号
[24] 马尔多纳多,S。;López,J.,通过二阶锥规划进行支持向量分类的嵌入式特征选择方法,智能数据分析,19,6,1259-1273(2015)
[25] 马尔多纳多,S。;韦伯,R。;Basak,J.,用于特征选择的核惩罚SVM,信息科学,181,1,115-128(2011)
[26] Martin-Barragan,B。;里洛,R。;Romo,J.,功能数据的可解释支持向量机,《欧洲运筹学杂志》,232,1,146-155(2014)
[27] Meier,L。;Van De Geer,S。;Buehlmann,P.,逻辑回归的群体套索,英国皇家统计学会杂志:B系列(统计方法论),70,1,53-71(2008)·Zbl 1400.62276号
[28] Neumann,J。;施诺尔,C。;Steidl,G.,基于svm的特征选择和分类组合,机器学习,61,1-3,129-150(2005)·Zbl 1137.90643号
[29] Pomeroy,S.L。;Tamayo,P。;加森贝克,M。;斯图拉·L·M。;安吉洛,M。;McLaughlin,M.E。;Kim,J.Y.H。;Goumnerova,L.C。;布莱克,P.M。;Lau,C。;艾伦,J。;Zagzag博士。;奥尔森,J。;柯兰,T。;Wetmore,C。;比格尔,J.A。;Poggio,T。;穆克吉,S。;里夫金,R。;加利福尼亚州。;斯托洛维茨基,G。;Louis,D.N。;梅西洛夫,J。;兰德,E。;Golub,T.,《基于基因表达的中枢神经系统胚胎性肿瘤预后预测》,《自然》,4156870436-442(2002)
[30] Rinaldi,F。;肖恩,F。;Sciandrone,M.,《多面体集上最小化零模的凹编程》,计算优化与应用,46,3,467-486(2010)·Zbl 1229.90170号
[31] Rockafellar,R.,凸分析,普林斯顿数学系列,第28期(1970年),普林斯顿大学出版社:普林斯顿大学出版,新泽西州普林斯顿·Zbl 0193.18401号
[32] Saketha Nath,J。;Bhattacharyya,C.,具有特定误报率和误报率的最大边缘分类器,SIAM国际数据挖掘会议论文集(2007)
[33] 希普,M.A。;Ross,K.N。;Tamayo,P。;翁,美联社。;库托克,J.L。;阿奎尔,R.C.T。;加森贝克,M。;安吉洛,M。;Reich,M。;平库斯,G.S。;Ray,T.S。;科瓦尔,医学硕士。;最后,K.W。;诺顿,A。;李斯特,T.A。;梅西洛夫,J。;Neuberg,D.S。;兰德,E.S。;Aster,J.C。;Golub,T.R.,通过基因表达谱和监督机器学习预测弥漫性大b细胞淋巴瘤的预后,自然医学,8,1,68-74(2002)
[34] Sturm,J.,使用sedumi 1.02,一个用于对称锥优化的matlab工具箱,优化方法和软件,11,12,625-653(1999)·Zbl 0973.90526号
[35] Thi,H.L。;Dinh,T.P.,用dc算法求解一类线性约束的不定二次型问题,《全局优化杂志》,11,3,253-285(1997)·Zbl 0905.90131号
[36] Thi,H.L。;Dinh,T.P.,《凸函数差分编程和dca与现实世界非凸优化问题的dc模型的重新审视》,运筹学年鉴,133,1,23-46(2005)·Zbl 1116.90122号
[37] Thi,H.L。;Dinh,T.P。;Muu,L.,用直流优化算法对有效集进行优化的数值解,《运筹学快报》,19,3,117-128(1996)·Zbl 0871.90074号
[38] Vapnik,V.,《统计学习理论》(1998),John Wiley and Sons·Zbl 0935.62007号
[39] 韦斯特,M.M。;C.C.布兰切特。;Dressman,H.H。;黄,E.E。;石田S.S。;斯潘,R.R。;Zuzan,H。;奥尔森,J。;马克斯,J。;Nevins,J.,利用基因表达谱预测人类乳腺癌的临床状态,美国国家科学院学报,98,20,11462-11467(2001)
[40] 韦斯顿,J。;Elisseeff,A。;Schlkopf,B。;Tipping,M.,《零形式与线性模型和核方法的使用》,《机器学习研究杂志》,31439-1461(2003)·Zbl 1102.68605号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。