×

降秩多标签分类。 (英语) Zbl 1505.62436号

摘要:多标签分类是经典二进制分类的自然推广,用于对多类标签进行分类。它不同于多类分类,因为多类标签不是唯一的。关键的挑战是通过在多个类标签之间加入内在的依赖结构来提高分类精度。在本文中,我们建议通过一个简化的多标签分类模型来建模依赖结构,并对稀疏估计实施组套索正则化。为了便于计算,开发了另一种优化方案,其中交替使用约束流形优化技术和梯度下降算法,以最大化生成的正则对数似然。通过各种仿真实例和两个实际应用证明了该方法的有效性。更重要的是,通过贝叶斯信息准则,根据估计和变量选择一致性以及模型选择一致性量化其渐近行为。

MSC公司:

62-08 统计问题的计算方法
62J12型 广义线性模型(逻辑模型)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Barker,M.,Rayens,W.:歧视的偏最小二乘法。《化学杂志》。17, 166-173 (2003) ·doi:10.1002/cem.785
[2] Barutcuoglu,Z.,Schapire,R.,Troyanskaya,O.:基因功能的层次多标记预测。生物信息学22,830-836(2006)·doi:10.1093/bioinformatics/btk048
[3] Boutell,M.R.,Luo,J.,Shen,X.,Brown,C.M.:学习多标签场景分类。模式识别。3711757-1771(2004年)·doi:10.1016/j.patcog.2004.03.009
[4] Breiman,B.,Friedman,J.H.:预测多元线性回归中的多元反应。J.R.Stat.Soc.59、354(1997年)·Zbl 0897.62068号 ·doi:10.1111/1467-9868.00054
[5] Briggs,F.、Lakshminarayanan,B.、Neal,L.、Fern,X.Z.、Raich,R.、Hadley,S.J.K.、Hadley,A.S.、Betts,M.G.:噪音环境中多个同时存在的鸟类的声学分类新方法。IEEE信号处理机器学习国际研讨会(2012年)
[6] Chen,L.S.,Huang,J.H.:同时降维和变量选择的稀疏缩减秩回归。《美国统计协会期刊》107,1533-1545(2012)·Zbl 1258.62075号 ·doi:10.1080/01621459.2012.734178
[7] Clare,A.,King,R.:多标签表型数据中的知识发现。第五届欧洲数据挖掘和知识发现原则会议。人工智能课堂讲稿,2168,第42-53页,(2001)·Zbl 1009.68730号
[8] Dumais,S.、Platt,J.、Heckerman,D.、Sahami,M.:文本分类的归纳学习算法和表示。《第七届信息和知识管理国际会议记录》,第148-155页,(1998年)
[9] Edelman,A.、Arias,T.A.、Smith,S.T.:具有正交约束的算法几何。SIAM J.矩阵分析。申请。20, 303-353 (1998) ·Zbl 0928.6500号 ·doi:10.1137/S0895479895290954
[10] Elisseeff,A.,Weston,J.:多标记分类的核心方法。高级神经信息处理。系统。14, 681-687 (2002)
[11] Fan,R.E.,Lin,C.J.:多标签分类阈值选择研究。国立台湾大学技术报告(2007)
[12] Izenman,A.J.:多元线性模型的降秩回归。J.多变量。分析。5248-264(1975年)·Zbl 0313.62042号 ·doi:10.1016/0047-259X(75)90042-1
[13] Luaces,O.,Dez,J.,Barranquero,J.、Jos del Coz,J..、Bahamonde,A.:多标签分类的二元相关性功效。掠夺。Artif公司。智力。4, 303-313 (2012) ·文件编号:10.1007/s13748-012-0030-x
[14] Madjarov,G.,Kocev,D.,Gjorgjevikj,D.,Dzeroski,S.:多标签学习方法的广泛实验比较。模式识别。45, 3084-3104 (2012) ·doi:10.1016/j.patcog.2012.03.004
[15] Nocedal,J.,Yuan,Y.X.:结合信赖域和线搜索技术。高级非线性程序。260, 153-175 (1998) ·Zbl 0909.90243号 ·doi:10.1007/978-14613-3335-77
[16] Peters,S.、Jacob,Y.、Denoyer,L.、Gallinari,P.:复杂社交网络的迭代多标签多关系分类算法。Soc.网络。分析。最小值217-29(2012)·doi:10.1007/s13278-011-0034-8
[17] Ravikumar,P.,Wainwright,S.,Raskutti,G.,Yu,B.:通过最小化l1-惩罚对数决定散度进行高维协方差估计。电子。J.Stat.5,935-980(2011年)·Zbl 1274.62190号 ·doi:10.1214/11-EJS631
[18] Read,J.,Pfahringer,B.,Holmes,G.,Frank,E.:多标签分类的分类器链。收录于:Buntine,W.、Grobelnik,M.、Mladenić,D.、Shawe-Taylor,J.(编辑)《数据库中的机器学习和知识发现》,第254-269页。施普林格(2009)
[19] Richtarik,P.,Takac,M.:大数据优化的平行坐标下降法。(2012),arXiv:1212.0873·Zbl 1342.90102号
[20] Rothman,A.,Bickel,P.,Levina,E.,Zhu,J.:稀疏置换不变协方差估计。电子。《美国法律总汇》第2卷第494-515页(2008年)·Zbl 1320.62135号 ·doi:10.1214/08-EJS176
[21] 邵,J.:《数理统计》,第二版。施普林格,纽约(2003)·Zbl 1018.62001号 ·数字对象标识代码:10.1007/b97553
[22] Schwarz,G.E.:估算模型的维数。Ann.Stat.6,461-464(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[23] Tsoumakas,G.,Katakis,I.:多标签分类:概述。国际数据仓库杂志。最小3,1-13(2007)·doi:10.4018/jdwm.2007070101
[24] Tsoumakas,G.,Katakis,I.,Vlahavas,I.:多标签分类的随机k标签集。IEEE传输。知识。数据工程231079-1089(2008)·doi:10.1109/TKDE.2010.164
[25] Wang,H.L.:关于自适应群套索的注释。计算。统计数据分析。52, 5277-5286 (2008) ·Zbl 1452.62524号 ·doi:10.1016/j.csda.2008.05.006
[26] Wang,J.,Wang,L.:高维分类中的稀疏监督降维。电子。J.Stat.4,914-931(2010年)·兹比尔1329.62292 ·doi:10.1214/10-EJS572
[27] Wen,Z.,Yin,W.:正交约束优化的可行方法。数学。程序。142, 397-434 (2013) ·Zbl 1281.49030号 ·doi:10.1007/s10107-012-0584-1
[28] Yu,H.F.,Jain,P.,Kar P.,Dhillon I.S.:缺少标签的大规模多标签学习。第31届机器学习国际会议论文集(2014)
[29] Yuan,M.,Lin,Y.:分组变量回归中的模型选择和估计。J.R.Stat.Soc.68,49-67(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[30] Zhang,M.L.,Zhou,Z.H.:多标签学习的懒惰学习方法。模式识别。40, 2038-2048 (2007) ·Zbl 1111.68629号 ·doi:10.1016/j.patcog.2006.12.019
[31] Zhou,Z.H.,Zhang,M.L.:多标签神经网络及其在功能基因组学和文本分类中的应用。IEEE传输。知识。Data Eng.18,1338-1351(2006)·doi:10.1109/TKDE.2006.162
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。