柔佛州鲁苏;克雷格·桑德斯;桑多·塞德马克;约翰·肖尔·泰勒 基于核的分层多标签分类模型学习。 (英语) Zbl 1222.68291号 J.马赫。学习。物件。 7, 1601-1626 (2006). 摘要:我们提出了一种基于内核的分层文本分类算法,其中允许文档一次属于多个类别。分类模型是最大裕度马尔可夫网络框架的一种变体,其中分类层次表示为一个马尔可夫树,该树的边缘上定义了一个指数族。我们提出了一种有效的优化算法,该算法基于边际对偶变量所跨越的单示例子空间中的增量条件梯度提升。基于动态规划的算法计算可行集中的最佳更新方向,有助于优化。实验表明,该算法可以有效地优化数千个样本的训练集和数百个节点组成的分类层次。全层次模型的训练与为每个节点训练独立的SVM-light分类器一样有效。该算法的预测精度与其他最近引入的分层多类别或多标签分类学习算法相比具有竞争力。 引用于14文件 理学硕士: 68T05年 人工智能中的学习和自适应系统 62小时30分 分类和区分;聚类分析(统计方面) 关键词:内核方法;等级分类法;文本分类;凸优化;结构化输出 软件:RCV1型 PDF格式BibTeX公司 XML格式引用 \textit{J.Rousu}等人,J.Mach。学习。第71601--1626号决议(2006年;Zbl 1222.68291) 全文: 链接