×

ML-KNN:多标签学习的懒惰学习方法。 (英语) Zbl 1111.68629号

摘要:多标签学习起源于对文本分类问题的研究,其中每个文档可能同时属于多个预定义主题。在多标签学习中,训练集由实例组成,每个实例都与一组标签相关联,任务是通过分析已知标签集的训练实例来预测未知实例的标签集。本文提出了一种基于传统K近邻算法的多标签惰性学习方法ML-KNN。具体来说,对于每个看不到的实例,首先识别其在训练集中的K个最近邻。然后,基于从这些相邻实例的标签集中获得的统计信息,即属于每个可能类的相邻实例的数量,利用最大后验原则来确定不可见实例的标签集合。在酵母基因功能分析、自然场景分类和自动网页分类三个不同的真实世界多标签学习问题上的实验表明,ML-KNN的性能优于一些成熟的多标签学习算法。

理学硕士:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] A.McCallum,EM训练的混合模型多标签文本分类,摘自:AAAI'99文本学习研讨会工作笔记,佛罗里达州奥兰多,1999年。;A.McCallum,EM训练的混合模型多标签文本分类,摘自:AAAI'99文本学习研讨会工作笔记,佛罗里达州奥兰多,1999年。
[2] 夏皮雷,R.E。;Singer,Y.,Boostexter:一个基于boosting的文本分类系统,Mach。学习。,39, 2/3, 135-168 (2000) ·Zbl 0951.68561号
[3] Elisseeff,A。;Weston,J.,《多标记分类的核心方法》(Dietterich,T.G.;Becker,S.;Ghahramani,Z.,《神经信息处理系统的进展》14(2002),麻省理工学院出版社:麻省理学学院出版社剑桥),681-687
[4] Boutel,M.R。;罗,J。;沈,X。;Brown,C.M.,学习多标签场景分类,模式识别,37,9,1757-1771(2004)
[5] A.Clare,R.D.King,多标签表型数据中的知识发现,收录于:L.D.Raedt,A.Siebes(编辑),《计算机科学讲义》,第2168卷,施普林格,柏林,2001年,第42-53页。;A.Clare,R.D.King,多标签表型数据中的知识发现,载于:L.D.Raedt,A.Siebes(编辑),《计算机科学讲义》,第2168卷,施普林格,柏林,2001年,第42-53页·Zbl 1009.68730号
[6] F.D.Comité,R.Gilleron,M.Tommasi,从文本和数据中学习多标签交替决策树,收录于:P.Perner,A.Rosenfeld(编辑),《计算机科学讲义》,第2734卷,Springer,柏林,2003年,第35-49页。;F.D.Comité,R.Gilleron,M.Tommasi,从文本和数据中学习多标签交替决策树,载:P.Perner,A.Rosenfeld(编辑),《计算机科学讲义》,第2734卷,施普林格,柏林,2003年,第35-49页·Zbl 1029.68568号
[7] D.W.Aha,关于懒惰学习的AI特别审查问题,Artif。因特尔。审查11。;D.W.Aha,关于懒惰学习的人工智能特别评论,人工智能。因特尔。复习11。
[8] N.Ueda,K.Saito,多标签文本的参数混合模型,收录于:S.Becker,S.Thrun,K.Obermayer(编辑),《神经信息处理系统进展》,第15卷,麻省理工学院出版社,马萨诸塞州剑桥,2003年,第721-728页。;N.Ueda,K.Saito,多标签文本的参数混合模型,收录于:S.Becker,S.Thrun,K.Obermayer(编辑),《神经信息处理系统进展》,第15卷,麻省理工学院出版社,马萨诸塞州剑桥,2003年,第721-728页。
[9] Sebastiani,F.,自动文本分类中的机器学习,ACM Compu。调查。,34, 1, 1-47 (2002)
[10] Salton,G.,《自动文本检索的发展》,《科学》,253974-980(1991)
[11] 高,S。;Wu,W。;Lee,C.-H。;Chua,T.-S.,稳健多类多标签文本分类的MFoM学习方法,(第21届机器学习国际会议论文集(2004),班夫:加拿大班夫),329-336
[12] H.Kazawa,T.Izumitani,H.Taira,E.Maeda,多主题文本分类的最大边距标记,收录于:L.K.Saul,Y.Weiss,L.Bottou(编辑),《神经信息处理系统进展》,第17卷,麻省理工学院出版社,马萨诸塞州剑桥,2005年,第649-656页。;H.Kazawa,T.Izumitani,H.Taira,E.Maeda,多主题文本分类的最大边距标记,收录于:L.K.Saul,Y.Weiss,L.Bottou(编辑),《神经信息处理系统的进展》,第17卷,麻省理工学院出版社,马萨诸塞州剑桥,2005年,第649-656页。
[13] 弗伦德,Y。;Schapire,R.E.,《在线学习的决策理论推广及其在助推中的应用》,J.Compute。系统。科学。,55, 1, 119-139 (1997) ·Zbl 0880.68103号
[14] Dempster,A.P。;莱尔德,新墨西哥州。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.B,39,1,1-38(1977)·Zbl 0364.62022号
[15] 弗伦德,Y。;Mason,L.,《交替决策树学习算法》(The alternative decision tree learning algorithm),第16届机器学习国际会议论文集(1999),布莱德:布莱德斯洛文尼亚),124-133
[16] R.E.Schapire,Y.Singer,《使用可信度预测改进的提升算法》,载于《第11届计算学习理论年会论文集》,纽约,1998年,第80-91页。;R.E.Schapire,Y.Singer,《使用可信度预测改进的提升算法》,载于《第11届计算学习理论年会论文集》,纽约,1998年,第80-91页·Zbl 0945.68194号
[17] 高,S。;Wu,W。;Lee,C.-H。;Chua,T.-S.,文本分类的最大数字-书面学习方法,(第26届国际ACM SIGIR信息检索研究与开发会议论文集(2003),多伦多:加拿大多伦多),174-181
[18] Quinlan,J.R.,C4.5:机器学习计划(1993),Morgan Kaufmann:Morgan Koufmann San Mateo,California
[19] R.Jin,Z.Ghahramani,《多标签学习》,收录于:S.Becker,S.Thrun,K.Obermayer(编辑),《神经信息处理系统进展》,第15卷,麻省理工学院出版社,马萨诸塞州剑桥,2003年,第897-904页。;R.Jin,Z.Ghahramani,《多标签学习》,收录于:S.Becker,S.Thrun,K.Obermayer(编辑),《神经信息处理系统进展》,第15卷,麻省理工学院出版社,马萨诸塞州剑桥,2003年,第897-904页。
[20] Pavlidis,P。;韦斯顿,J。;蔡,J。;Grundy,W.N.,《使用支持向量机结合微阵列表达数据和系统发育特征来学习功能类别》,(第五届国际计算生物学年会论文集(2001年),蒙特利尔:加拿大蒙特利尔),242-248
[21] Yang,Y。;Pedersen,J.O.,文本分类中特征选择的比较研究,(第14届机器学习国际会议论文集(1997),纳什维尔:纳什维尔TN),412-420
[22] Dumais,S.T。;普拉特,J。;赫克曼,D。;Sahami,M.,文本分类的归纳学习算法和表示,(第七届ACM信息和知识管理国际会议论文集(1998),贝塞斯达:贝塞斯达MD),148-155
[23] 张,M.-L。;Zhou,Z.-H.,多标签神经网络及其在功能基因组学和文本分类中的应用,IEEE T.Knowl。数据En。,18, 10, 1338-1351 (2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。