@进行中{bhandari-goyal-2022-bitsa,title=“bitsa{\_}nlp@{LT}-{EDI}-{ACL}2022:利用预先训练的语言模型检测社交媒体评论中的同性恋恐惧症和跨恐惧症”,author=“班达里、维塔尔和Goyal,Poonam”,editor=“Chakravarthi、Bharathi Raja和Bharathi,B和麦克雷、约翰·P和扎鲁克、马内尔和巴厘岛、卡利卡岛和Paul Buitelaar“,booktitle=“语言技术促进平等、多样性和包容性第二次研讨会会议记录”,月=5月,年=“2022”,address=“爱尔兰都柏林”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.ltedi-1.18”,doi=“10.18653/v1/2022.ltedi-1.18”,pages=“149--154”,abstract=“在线社交网络无处不在且用户友好。然而,检测并缓和攻击性内容以保持体面和同理心至关重要。然而,挖掘社交媒体文本是一项复杂的任务,因为用户不需要{'}不要坚持任何固定的模式。评论可以用任何语言组合编写,其中许多可能资源不足。本文介绍了我们的LT-EDI共享任务系统,用于检测社交媒体评论中的同性恋恐惧症和跨恐怖症。我们实验了许多基于单语和多语言转换器的模型,如mBERT,以及用于解决类不平衡的数据增强技术。这种经过预处理的大型模型最近在自然语言处理的各种基准测试任务中取得了巨大成功。我们在一个经过仔细注释的YouTube英语和泰米尔语评论的真实数据集上观察了他们的表现。我们的提交在英语、泰米尔语和泰米尔文-英语子任务中的宏观平均F1分数分别为0.42、0.64和0.58,排名分别为9、6和3。系统的代码已经开源。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“bhandari-goyal-2022-bitsa”><标题信息><标题>bitsa_nlp@LT-EDI-ACL2022:利用预先训练的语言模型检测社交媒体评论中的同性恋恐惧症和跨恐惧症</titleInfo><name type=“personal”>维塔尔班达里<角色>作者</角色></name><name type=“personal”><namePart type=“given”>普南戈亚尔<角色>作者</角色></name><originInfo>2022-05发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>语言技术促进平等、多样性和包容性第二次研讨会会议记录</titleInfo><name type=“personal”>巴拉提拉贾查克拉瓦尔蒂<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>B</namePart>巴拉提<角色>编辑器</角色></name><name type=“personal”>约翰<namePart type=“given”>P</namePart><namePart type=“family”>麦克雷</namePart><角色>编辑器</角色></name><name type=“personal”>曼内尔扎鲁克<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>卡利卡</namePart>巴厘岛<角色>编辑器</角色></name><name type=“personal”>保罗Buildelaar建筑<角色>编辑器</角色></name><originInfo>计算语言学协会<地点>爱尔兰都柏林</place></originInfo>会议出版物</relatedItem>在线社交网络无处不在,用户友好。然而,检测和缓和冒犯性内容以保持体面和同理心至关重要。然而,挖掘社交媒体文本是一项复杂的任务,因为用户不遵循任何固定的模式。评论可以用任何语言组合编写,其中许多可能资源不足。本文介绍了我们的LT-EDI共享任务系统,用于检测社交媒体评论中的同性恋恐惧症和跨恐怖症。我们实验了许多基于单语和多语言转换器的模型,如mBERT,以及用于处理类不平衡的数据增强技术。这种经过预处理的大型模型最近在自然语言处理的各种基准测试任务中取得了巨大成功。我们在一个经过仔细注释的YouTube英语和泰米尔语评论的真实数据集上观察了他们的表现。我们的提交在英语、泰米尔语和泰米尔文-英语子任务中的宏观平均F1分数分别为0.42、0.64和0.58,排名分别为9、6和3。该系统的代码是开源的</摘要>bhandari-goyal-2022-bitsa10.18653/v1/2022.ltedi-1.18<位置><网址>https://aclantology.org/2022.ltedi-1.18</url></位置><部分>2022-05年<扩展单元=“page”><开始>149<end>154</范围></部分></mods></modsCollection>
%0会议记录%T型bitsa_nlp@LT-EDI-ACL2022:利用预先训练的语言模型检测社交媒体评论中的同性恋恐惧症和跨恐惧症%维塔尔·班达里%A Goyal,蓬南%Y Chakravarthi,Bharathi Raja%Y Bharathi,B。%Y McCrae,John P。%马内尔·扎鲁克%Y巴厘岛,卡利卡%保罗·Y·布伊特拉尔%语言技术促进平等、多样性和包容性第二次研讨会论文集%D 2022年%5月8日%计算语言学协会%C都柏林,爱尔兰%F bhandari-goyal-2022-bitsa公司%X在线社交网络无处不在,用户友好。然而,检测和缓和冒犯性内容以保持体面和同理心至关重要。然而,挖掘社交媒体文本是一项复杂的任务,因为用户不遵循任何固定的模式。评论可以用任何语言组合编写,其中许多可能是低资源的。本文介绍了我们的LT-EDI共享任务系统,用于检测社交媒体评论中的同性恋恐惧症和跨恐怖症。我们实验了许多基于单语和多语言转换器的模型,如mBERT,以及用于处理类不平衡的数据增强技术。这种经过预处理的大型模型最近在自然语言处理的各种基准测试任务中取得了巨大成功。我们在一个经过仔细注释的YouTube英语和泰米尔语评论的真实数据集上观察了他们的表现。我们的提交在英语、泰米尔语和泰米尔文-英语子任务中的宏观平均F1分数分别为0.42、0.64和0.58,排名分别为9、6和3。系统的代码已经开源。%R 10.18653/v1/2022.ltedi-1.18号%U型https://aclantology.org/2022.ltedi-1.18%U型https://doi.org/10.18653/v1/2022.ltedi-1.18%电话149-154
降价(非正式)
[bitsa_nlp@LT-EDI-ACL2022:利用预先训练的语言模型检测社交媒体评论中的同性恋恐惧症和跨恐惧症](https://aclantology.org/2022.ltedi-1.18)(班达里和戈亚尔,LTEDI 2022)
国际计算语言学协会