科比·克拉默;马克·德雷泽;费尔南多·佩雷拉 用于文本分类的置信加权线性分类。 (英语) 兹比尔1432.68382 J.马赫。学习。物件。 13, 1891-1926 (2012). 摘要:可信度加权在线学习是线性分类器基于边缘的学习的推广,其中边缘约束被基于分类器权重分布的概率约束所取代,分类器权重分布随着示例的观察而在线更新。该分布捕获了分类器权重的置信度概念,在某些情况下,它也可以被解释为用自适应的每权重率取代单个学习率。可信度加权学习的动机是自然语言分类任务的统计特性,其中大多数信息特征相对较少。我们研究了几个版本的置信度加权学习,这些学习在权重向量上使用高斯分布,并在每个观察到的示例中进行更新,以实现示例的高正确分类概率。对一系列文本分类任务的实证评估表明,我们的算法优于其他最先进的在线和批处理方法,在在线环境中学习更快,并为云计算中常用的一种分布式训练提供更好的分类器组合。 引用于13文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 62H30型 分类和区分;聚类分析(统计方面) 68T50型 自然语言处理 68周27 在线算法;流式算法 关键词:在线学习;置信预测;文本分类 PDF格式BibTeX公司 XML格式引用 \文本{K.Crammer}等人,J.Mach。学习。1891-1926年第13号决议(2012年;Zbl 1432.68382) 全文: 链接