2018

[1]

在线性能评估框架:数据流异构集成学习

Jan N.van Rijn,Geoffrey Holmes,Bernhard Pfahringer,和Joaquin Vanschoren。《在线性能评估框架:异构集成 数据流学习》。机器学习,107(1):149-1762018年。
[围兜|http协议]
分类器集合是许多数据挖掘应用程序(包括数据流挖掘)中性能最好的分类器之一。不是训练一个分类器,而是训练多个分类器,并根据给定的投票时间表组合它们的预测。合奏成功的一个重要先决条件是单个模型是多样化的。大幅度增加模型多样性的一种方法是构建一个由根本不同的模型类型组成的异构集成。然而,大多数专门为动态数据流设置开发的集成只依赖于一种基本级别分类器,通常是hoefffding树。我们研究了异构集成在数据流中的应用,引入了在线性能评估框架,该框架动态地对集成中单个分类器的投票进行加权,权重和他们的成员在这方面的表现如何。在广泛的数据流上进行的实验表明,性能与最先进的集成技术相比具有竞争力,包括在线打包和利用打包,同时速度明显更快。这项工作的所有实验结果都很容易重复,并且可以在网上公开。

[2]

SemEval-2018任务1:微博中的情感

赛义夫•M•穆罕默德、菲利佩•布拉沃•马奎兹、穆罕默德•萨拉梅和斯维特兰娜•基里琴科。 2018年第1期任务:推特中的影响语义评价国际研讨会论文集(SemEval-2018),新奥尔良,洛杉矶,美国,2018年。
[围兜|.pdf格式]
我们提出了SemEval-2018任务1:在Tweets中影响,其中包括一系列子任务,从tweet推断一个人的情感状态。对于每个任务,我们从英语、阿拉伯语和西班牙语tweet中创建标记为 的数据。情绪强度 回归,2。情感强度分类。价(情绪)回归,4。价序数分类,5。情感分类。75个团队(约200名团队成员)参与了这项共享任务。我们总结了参与团队使用的方法、资源和工具,重点介绍了特别有用的技术和资源。我们还分析了系统对特定种族或性别的一贯偏见。这些数据是免费提供的,以进一步提高我们对人们如何通过语言传达情感的理解。