SuperTweetEval: A Challenging, Unified and Heterogeneous Benchmark for Social Media NLP Research

Antypas, Dimosthenis; Ushio, Asahi; Barbieri, Francesco; Neves, Leonardo; Rezaee, Kiamehr; Espinosa-Anke, Luis; Pei, Jiaxin; Camacho-Collados, Jose

计算机科学>计算与语言

arXiv:2310.14757（cs）

【于2023年10月23日提交】

标题：SuperTweetEval：社交媒体NLP研究的挑战性、统一性和异构性基准

作者：迪莫斯坦尼斯·安提帕,朝日Ushio,弗朗西斯科·巴比埃里,莱昂纳多·内维斯,Kiamehr Rezaee公司,路易斯·埃斯皮诺萨·安克,裴佳欣,何塞·卡马乔·科拉多斯

查看PDF

摘要：尽管NLP具有相关性，但与通用模型、指标和基准相比，社交媒体NLP的成熟度相形见绌。这种支离破碎的局面使得社区很难知道，例如，给定一项任务，哪种模型表现最佳，以及与其他模型的比较。为了缓解这个问题，我们在社交媒体中引入了一个统一的NLP评估基准SuperTweetval，它包括一组从零开始组合、调整和构建的异构任务和数据集。我们对SuperTweetEval上一系列模型的性能进行了基准测试，结果表明，尽管语言建模方面取得了最新进展，但社交媒体仍然具有挑战性。

评论：	EMNLP 2023调查结果
学科：	计算与语言（cs.CL）
引用为：	arXiv:2310.14757【cs.CL】
	（或 arXiv:2310.14757v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2310.14757

提交历史记录

发件人：旭化Ushio[查看电子邮件]
[第1版]2023年10月23日星期一09:48:25 UTC（8395 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

完。氯

<上一版本 | 下一个>

新的 | 最近的 |2023-10

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>计算与语言

标题：SuperTweetEval：社交媒体NLP研究的挑战性、统一性和异构性基准

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：SuperTweetEval：社交媒体NLP研究的挑战性、统一性和异构性基准

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目