×

基于核的分层多标签分类模型学习。 (英语) Zbl 1222.68291号

摘要:我们提出了一种基于内核的分层文本分类算法,其中允许文档一次属于多个类别。分类模型是最大裕度马尔可夫网络框架的一种变体,其中分类层次表示为一个马尔可夫树,该树的边缘上定义了一个指数族。我们提出了一种有效的优化算法,该算法基于边际对偶变量所跨越的单示例子空间中的增量条件梯度提升。基于动态规划的算法计算可行集中的最佳更新方向,有助于优化。实验表明,该算法可以有效地优化数千个样本的训练集和数百个节点组成的分类层次。全层次模型的训练与为每个节点训练独立的SVM-light分类器一样有效。该算法的预测精度与其他最近引入的分层多类别或多标签分类学习算法相比具有竞争力。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)

软件:

RCV1型
PDF格式BibTeX公司 XML格式引用
全文: 链接