Forum 4.0:开源用户评论分析框架

马洛·海林,雅各布·斯梅德加德·安德森,克里斯·比曼,Wiebke松开,本杰明·米尔德,蒂姆·皮茨,克里斯蒂安·施托克,格雷戈·维德曼,奥拉夫·祖昆夫特,瓦利德·马莱吉


摘要
随着不同领域用户评论数量的增加,包括在线新闻和电子商务网站上的评论,手动分析这些评论的内容变得既耗时又具有挑战性。然而,研究表明,用户评论包含对不同领域专家有用的信息,因此值得查找和利用。本文介绍了Forum 4.0,这是一个开源框架,用于基于领域专家定义的标签半自动分析、聚合和可视化用户评论。我们通过在线新闻和应用程序商店领域的评论分析场景展示了论坛4.0的适用性。我们概述了底层容器体系结构,包括基于web的用户界面、机器学习组件和耗时任务的任务管理器。最后,我们用模拟注释和不同的采样策略对两个领域的现有数据集进行机器学习实验,以评估Forum 4.0的性能。Forum 4.0利用基于变压器的嵌入和轻量级logistic回归模型,实现了有希望的分类结果(ROC-AUC≥0.9,带100个注释样本)。我们解释了Forum 4.0的架构如何以可行的培训和分类成本实时适用于数百万用户的评论。
选集ID:
2021.每个演示。8
体积:
计算语言学协会欧洲分会第16届会议记录:系统演示
月份:
四月
年份:
2021
地址:
在线的
编辑:
迪米特拉·格卡齐亚,杰梅·塞达
地点:
EACL公司
信号:
发布者:
计算语言学协会
注:
页:
63–70
语言:
网址:
https://aclantology.org/2021.eacl-demos.8
内政部:
10.18653/v1/2021。eacl演示。8
比比键:
引用(ACL):
马洛·哈林(Marlo Haering)、雅各布·斯梅德加德·安徒生(Jakob Smedegaard Andersen)、克里斯·比曼(Chris Biemann)、威比克·里斯克(Wiebke Lonse)、本杰明·米尔德(Benjamin Milde)、蒂姆·皮茨(Tim Pietz)、克里斯蒂安·施托克(Christian Stöcke。2021Forum 4.0:开源用户评论分析框架.英寸计算语言学协会欧洲分会第16届会议记录:系统演示,第63-70页,在线。计算语言学协会。
引用(非正式):
Forum 4.0:开源用户评论分析框架(Haering等人,EACL 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.eacl-demos.8.pdf