×

基于网络的多分类判别分析。 (英语) Zbl 07646902号

摘要:多标签响应的分类,即多分类,一直是监督学习中的一个重要问题,引起了我们的关注。在统计学习的框架中,判别分析是进行多分类的一种强有力的方法。随着复杂数据的可用性不断增加,分析这些数据变得更加困难。复杂数据的一个重要特征是网络结构,由于变量之间的强相关性或弱相关性,网络结构在高维数据中普遍存在。尽管判别分析是处理多分类的监督学习方法之一,并且已经探索了相关的扩展,但对于适应网络结构的多分类处理方法却很少。为了将网络结构纳入预测因子并提高分类的准确性,本文提出了基于网络的线性判别分析和基于网络的二次判别分析。该方法的主要优点是直接估计协方差矩阵的逆,并对多标签响应进行分类,而不局限于二进制响应。此外,所提出的方法易于计算和实现。最后,进行了数值研究以评估所提方法的性能,数值结果验证了所提方法优于其竞争对手。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.(1973)。信息论和最大似然原理的推广。N.Petrov F.Czaki(编辑),第二届信息理论国际研讨会(第267-281页)。Bydapest:Akademiai Kaido·Zbl 0283.62006号
[2] 巴拉丹达尤萨帕尼,V。;Talluri,R。;纪毅。;肯塔基州库姆斯;Lu,Y。;英国轩尼诗;戴维斯,马萨诸塞州;Mallick,BK,用于蛋白质表达数据分类的贝叶斯稀疏图形模型,应用统计学年鉴,81443-1468(2014)·Zbl 1303.62057号 ·doi:10.1214/14-AOAS722
[3] 巴吉洛夫,AM;弗格森,B。;伊夫科维奇,S。;桑德斯,G。;Yearwood,J.,利用肿瘤基因表达特征进行多类癌症诊断的新算法,生物信息学,19,1800-1807(2003)·doi:10.1093/bioinformatics/btg238
[4] 比奇亚托,S。;Luchini,A。;Bello,CD,使用基因表达数据进行多类癌症分析的PCA不相交模型,生物信息学,19571-578(2003)·doi:10.1093/bioinformatics/btg051
[5] 比尔扎,C。;Li,G.等人。;Larrañaga,P.,用贝叶斯网络进行多维分类,国际近似推理杂志,52705-727(2011)·Zbl 1226.68078号 ·doi:10.1016/j.ijar.2011.01.007
[6] 蔡伟(Cai,W.)。;关,G。;潘,R。;朱,X。;Wang,H.,网络线性判别分析,计算统计与数据分析,117,32-44(2018)·Zbl 1469.62028号 ·doi:10.1016/j.csda.2017.07.007
[7] 陈,J。;Chen,Z.,《小n大P水疗的扩展BIC GLM》,中国统计局,22,555-574(2012)·Zbl 1238.62080号 ·doi:10.5705/ss.2010.216
[8] Chen,L-P,具有一些复杂特征的基因表达数据的多重分类,生物统计学和生物统计学开放存取期刊,9,555751(2018)·doi:10.19080/BBOAJ.2018.09.555751
[9] Chen,L.-P.(2019)。具有测量误差的复杂特征数据的生存分析。UWSpace公司。http://hdl.handle.net/10012/14927。
[10] 陈,L-P;Yi,GY;张,Q。;He,W.,用网络结构协变量进行多类分析和预测,《统计分布与应用杂志》,6,6(2019)·Zbl 1478.62160号 ·doi:10.1186/s40488-019-0094-2
[11] 陈,L-P;Yi,GY,用图形比例危险测量误差模型分析噪声生存数据,生物计量学,77956-969(2021)·兹比尔1520.62162 ·doi:10.1111/biom.13331
[12] 克莱门森,L。;哈斯蒂,T。;维滕,D。;Ersböll,B.,稀疏判别分析,技术计量学,53,406-413(2011)·doi:10.1198/TECH.2011.08118
[13] 范,J。;Li,R.,基于非协调惩罚似然的变量选择及其预言性质。,《美国统计协会杂志》,96,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[14] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[15] 郭毅。;哈斯蒂,T。;Tibshirani,R.,正则化线性判别分析及其在微阵列中的应用,生物统计学,886-100(2007)·Zbl 1170.62382号 ·doi:10.1093/biostatistics/kxj035
[16] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素:数据挖掘、推断和预测》(2008),纽约:施普林格出版社,纽约
[17] 哈斯蒂,T。;Tibshirani,R。;Wainwright,M.,《稀疏的统计学习:套索和泛化》(2015),纽约:CRC出版社,纽约·Zbl 1319.68003号 ·doi:10.1201/b18401
[18] He,W.,Yi,G.Y.,&Chen,L.-P.(2019)。特征中具有图形网络结构的支持向量机。《模式识别中的机器学习和数据挖掘论文集》,第15届机器学习与数据挖掘国际会议,2019年MLDM,(第二卷,第557-570页)。
[19] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218(1985)·doi:10.1007/BF01908075
[20] 詹姆斯·G。;维滕,D。;哈斯蒂,T。;Tibshirani,R.,《统计学习导论:R中的应用》(2017),纽约:施普林格出版社,纽约
[21] 刘,JJ;卡特勒,G。;李伟(Li,W.)。;潘,Z。;彭,S。;Hoey,T。;Chen,L。;Ling,XB,使用基于遗传算法的多类癌症分类和生物标记物发现,生物信息学,212691-2697(2005)·doi:10.1093/bioinformatics/bti419
[22] 明绍森,N。;Bühlmann,P.,用套索选择高维图和变量,《统计年鉴》,341436-1462(2006)·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[23] Miguel Hernández-Lobato,J。;埃尔南德斯·洛巴托博士。;Suárez,A.,基于网络的稀疏贝叶斯分类,模式识别,448886-900(2011)·Zbl 1213.68528号 ·doi:10.1016/j.patcog.2010.10.016
[24] 彼得森,CB;Stingo,FC;Vannucci,M.,带网络结构预测因子回归模型的联合贝叶斯变量和图选择,《医学统计学》,35,1017-1031(2015)·数字对象标识代码:10.1002/sim.6792
[25] 拉维库马尔,P。;温赖特,MJ;Lafferty,J.,《使用▽1-正则化Logistic回归选择高维Ising模型》,《统计年鉴》,381287-1319(2010)·兹比尔1189.62115 ·doi:10.1214/09-AOS691
[26] 东南萨福;Ahn,J.,通用稀疏多类线性判别分析,计算统计与数据分析,99,81-90(2016)·Zbl 1468.62170号 ·doi:10.1016/j.csda.2016.01.011
[27] Schwarz,G.,估算模型的维度,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[28] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会杂志》。B系列,58267-288(1996)·Zbl 0850.62538号
[29] Wang,H。;李,R。;Tsai,C.,平滑剪裁绝对偏差方法的调整参数选择器,Biometrika,94,553-568(2007)·Zbl 1135.62058号 ·doi:10.1093/biomet/asm053
[30] Wan,Y-W;艾伦,GI;贝克,Y。;杨,E。;拉维库马尔,P。;安德森,M。;Liu,Z.,XMRF:将马尔可夫网络应用于高通量遗传学数据的R包,BMC系统生物学,10,Suppl 3,69(2016)·doi:10.1186/s12918-016-0313-0
[31] 维滕,DM;Tibshirani,R.,《使用Fisher线性判别法进行惩罚分类》,《皇家统计学会杂志》,B辑,73753-772(2011)·Zbl 1228.62079号 ·doi:10.1111/j.1467-9868.2011.00783.x
[32] 杨,E。;拉维库马尔,P。;艾伦,GI;Liu,Z.,基于单变量指数族分布的图形模型,《机器学习研究杂志》,16,3813-3847(2015)·Zbl 1351.62111号
[33] Yi,GY;Tan,X。;Li,R.,《具有缺失观测值和协变量测量误差的纵向数据边际分析的变量选择和推断程序》,《加拿大统计杂志》,43,498-518(2015)·Zbl 1329.62330号 ·doi:10.1002/cjs.11268
[34] 袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,生物统计学,94,19-35(2007)·兹比尔1142.62408 ·doi:10.1093/biomet/asm018
[35] 赵,T。;刘,H。;罗德,K。;Lafferty,J。;Wasserman,L.,《R中高维无向图估计的巨大包》,《机器学习研究杂志》,第13期,第1059-1062页(2012年)·Zbl 1283.68311号
[36] Zou,H.,自适应套索及其预言属性。,《美国统计协会杂志》,1011418-1429(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。