CNLP-NITS-PP at WANLP 2022 Shared Task: Propaganda Detection in Arabic using Data Augmentation and AraBERT Pre-trained Model

Sahinur Rahman Laskar; Rahul Singh; Abdullah Faiz Ur Rahman Khilji; Riyanka Manna; Partha Pakray; Sivaji Bandyopadhyay

doi:10.18653/v1/2022.wanlp-1.65

CNLP公司-NITS公司-聚丙烯在WANLP公司2022共享任务：中的宣传检测A类使用数据增强和A类ra（无线电高度表）BERT（误码率）预训练模型

萨希努·拉赫曼·拉斯卡尔,拉赫尔·辛哈,阿卜杜拉·法伊兹·乌尔·拉赫曼·基尔吉,Riyanka Manna公司,Partha Pakray公司,锡瓦吉·班迪奥帕提亚

摘要

在当今时代，网络用户经常接触到宣传性的媒体帖子。为了应对这种情况，已经制定了若干战略来促进阿拉伯语媒体的安全消费。然而，可用的多标签注释社交媒体数据集有限。在这项工作中，我们通过数据增强在扩展的列车数据上使用了一个预训练的AraBERT推特基模型。我们的团队CNLP-NITS-PP在WANLP-2022的子任务1中取得了第三名，阿拉伯语宣传检测（共享任务）的micro-F1得分为0.602。

选集ID：: 2022.wanlp-1.65年
体积：: 第七届阿拉伯语自然语言处理研讨会（WANLP）论文集
月份：: 十二月
年份：: 2022
地址：: 阿拉伯联合酋长国阿布扎比（混合）
编辑：: Houda Bouamor公司,亨德·哈利法,卡里姆·达维什,欧文·兰博,费提·布加雷斯,艾哈迈德·阿卜杜拉利,纳迪·托梅,萨拉姆哈里发,瓦迪·扎古瓦尼
地点：: WANLP公司
信号：
出版商：: 计算语言学协会
注：
页：: 541–544
语言：
网址：: https://aclantology.org/2022.wanlp-1.65
内政部：: 10.18653/v1/2022.wanlp-1.65
比比键：
引用（ACL）：: 萨希努·拉赫曼·拉斯卡尔（Sahinur Rahman Laskar）、拉胡尔·辛格（Rahul Singh）、阿卜杜拉·法伊兹·乌尔·拉赫曼·基尔吉（Abdullah Faiz Ur Rahman Khilji）、里扬卡·曼纳（Riyanka Manna）、帕塔·巴克利（Partha Pakray）和西瓦。2022WANLP 2022的CNLP-NITS-PP共享任务：使用数据增强和AraBERT预训练模型进行阿拉伯语宣传检测.英寸第七届阿拉伯语自然语言处理研讨会（WANLP）会议记录，第541–544页，阿拉伯联合酋长国阿布扎比（混合）。计算语言学协会。
引用（非正式）：: WANLP 2022的CNLP-NITS-PP共享任务：使用数据增强和AraBERT预训练模型进行阿拉伯语宣传检测（拉斯卡尔等人，WANLP 2022）
复制引文：
PDF格式：: https://aclantology.org/2022.wanlp-1.65.pdf

PDF格式引用搜索