×

用于文本分类的置信加权线性分类。 (英语) 兹比尔1432.68382

摘要:可信度加权在线学习是线性分类器基于边缘的学习的推广,其中边缘约束被基于分类器权重分布的概率约束所取代,分类器权重分布随着示例的观察而在线更新。该分布捕获了分类器权重的置信度概念,在某些情况下,它也可以被解释为用自适应的每权重率取代单个学习率。可信度加权学习的动机是自然语言分类任务的统计特性,其中大多数信息特征相对较少。我们研究了几个版本的置信度加权学习,这些学习在权重向量上使用高斯分布,并在每个观察到的示例中进行更新,以实现示例的高正确分类概率。对一系列文本分类任务的实证评估表明,我们的算法优于其他最先进的在线和批处理方法,在在线环境中学习更快,并为云计算中常用的一种分布式训练提供更好的分类器组合。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
68T50型 自然语言处理
68周27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用
全文: 链接