二千零一十八

[]

在线性能评估框架:数据流的异构集成学习

简·N·范里恩,Geoffrey Holmes,Bernhard Pfahringer和Joaquin Vanschoren。在线性能估计框架:数据流的异构集成学习。机器学习,107(1):149~176,2018。
[围兜γHTTP协议]
分类器集合是在许多数据挖掘应用中可用的最好的分类器之一,包括数据流的挖掘。不是训练一个分类器,而是对多个分类器进行训练,并根据给定的投票计划将它们的预测组合起来。合奏成功的一个重要前提是个体模型是多样的。极大地增加模型之间的多样性的一种方法是建立一个异构的集成,包括基本上不同的模型类型。然而,大多数集合专门针对动态数据流设置专门依赖于仅一种类型的基础级分类器,通常是Hoffd树。我们研究了用于数据的异构集成。溪流介绍一种在线性能估计框架,该框架动态地对集成中各个分类器的投票权进行加权。它测量集成程序在这个过程上的执行情况,并动态地更新它们的权重。在广泛的数据流上的实验显示了与最先进的集成技术竞争的性能,包括在线装袋和杠杆装袋,同时显著快。这项工作的所有实验结果都是容易再现和公开可用的在线。

[]

SeValE-2018任务1:在推文中的影响

赛义夫·M·穆罕默德,Felipe Bravo Marquez,Mohammad Salameh和斯维特兰娜·基里钦科。SeValE-2018任务1:在推文中的影响。语义评价国际研讨会论文集(SeValE-2018),新奥尔良,LA,美国,2018。
[围兜γPDF]
我们提出了SeValE-2018任务1:Twitter中的“影响”,它包括一个子任务数组,用于推断从他们的twitt来的人的情感状态。对于每个任务,我们创建了来自英语、阿拉伯语和西班牙语鸣叫的标记数据。每个任务是:1。情绪强度回归,2。情绪强度顺序分类,3。价(情绪)回归,4。价序数分类,5。情绪分类。七十五个团队(约200名团队成员)参与了共享任务。我们总结了参与团队使用的方法、资源和工具,重点是技术和资源,特别有用。我们还分析了系统对特定种族或性别的一贯偏见。这些数据是免费提供的,进一步提高我们对人们如何通过语言表达情感的理解。