@正在进行{lin-etal-2023-toxicchat,title=“{T}有毒{C}帽子:揭示现实世界用户中有毒检测的隐藏挑战-{AI}对话”,author=“林、子和Wang、Zihan和Tong、Yongqi和王、杨坤和郭玉新和王玉佳和Shang,Jingbo“,editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“计算语言学协会的发现:EMNLP 2023”,月=12月,年份=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.findings-emnlp.311”,doi=“10.18653/v1/2023.findings-emnlp.311”,pages=“4694--4702”,抽象=“尽管如今大型语言模型在聊天机器人中取得了显著进步,但保持无毒的用户-人工智能交互环境如今变得越来越重要。然而,以前在毒性检测方面的努力大多基于社交媒体内容的基准,留下了固有的独特挑战对真实用户与AI的交互研究不足。在这项工作中,我们介绍了ToxicChat,这是一个基于开源聊天机器人的真实用户查询构建的新基准。该基准包含丰富而微妙的现象,当前的毒性检测模型很难识别这些现象,与社交媒体内容相比,显示出显著的领域差异。我们对在现有毒性数据集上训练的模型的系统评估表明,当应用于ToxicChat的这一独特领域时,它们存在不足。我们的工作阐明了在真实的用户-人工智能对话中,毒性检测可能被忽视的挑战。未来,ToxicChat可以成为一种宝贵的资源,推动进一步发展,为用户与AI的交互构建一个安全健康的环境。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“lin-etal-2023-toxicchat”><标题信息>有毒聊天:揭示现实世界用户与AI对话中有毒物质检测的潜在挑战</titleInfo><name type=“personal”>Zi<namePart type=“given”>Zi</namePart><namePart type=“family”>林</namePart><角色>作者</角色></name><name type=“personal”>紫韩王<namePart type=“family”><角色>作者</角色></name><name type=“personal”>永奇童<namePart type=“family”><角色>作者</角色></name><name type=“personal”>杨坤王<namePart type=“family”><角色>作者</角色></name><name type=“personal”><namePart type=“given”>裕信</namePart>郭<namePart type=“family”><角色>作者</角色></name><name type=“personal”>于佳<namePart type=“given”>王<namePart type=“family”><角色>作者</角色></name><name type=“personal”>京波<namePart type=“given”>尚<角色>作者</角色></name><originInfo>2023-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会的发现:EMNLP 2023</titleInfo><name type=“personal”>侯达<namePart type=“family”>Bouamor</namePart><角色>编辑器</角色></name><name type=“personal”>胡安皮诺<角色>编辑器</角色></name><name type=“personal”>卡利卡语巴厘岛<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>新加坡</place></originInfo>会议出版物</relatedItem><abstract>尽管大型语言模型在聊天机器人中取得了显著进步,但保持无毒的用户-人工智能交互环境如今变得越来越重要。然而,之前在毒性检测方面的工作大多基于社交媒体内容的基准,因此对真实世界用户与人工智能交互固有的独特挑战缺乏充分的研究。在这项工作中,我们介绍了ToxicChat,这是一个基于开源聊天机器人的真实用户查询构建的新基准。该基准包含丰富而微妙的现象,当前的毒性检测模型很难识别这些现象,与社交媒体内容相比,显示出显著的领域差异。我们对根据现有毒性数据集训练的模型进行的系统评估表明,当应用于ToxicChat这一独特领域时,它们存在缺陷。我们的工作阐明了在真实的用户-人工智能对话中,毒性检测可能被忽视的挑战。未来,ToxicChat可以成为一种宝贵的资源,推动进一步发展,为用户与AI的交互构建一个安全健康的环境</摘要>在线-2023-toxicchat10.18653/v1/2023.findings-emnlp.311<位置><网址>https://aclantology.org/2023.findings-emnlp.311</url></位置><部分>2023-12年<扩展单元=“page”><开始>4694</开始><end>4702</范围></部分></mods></modsCollection>
%0会议记录%T有毒聊天:揭示现实世界用户与AI对话中有毒物质检测的潜在挑战%阿琳,子%王子翰%阿彤、永奇%A Wang,杨坤%A Guo,余欣%A Wang,于佳%阿尚、晶波%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%计算语言学协会的发现:EMNLP 2023%D 2023年%12月8日%计算语言学协会%C新加坡%F线性-2023-toxicchat%X尽管大型语言模型在聊天机器人中取得了显著进步,但保持无毒的用户-人工智能交互环境如今变得越来越重要。然而,之前在毒性检测方面的工作大多基于社交媒体内容的基准,因此对真实世界用户与人工智能交互固有的独特挑战缺乏充分的研究。在这项工作中,我们介绍了ToxicChat,这是一个基于开源聊天机器人的真实用户查询构建的新基准。该基准包含丰富而微妙的现象,当前的毒性检测模型很难识别这些现象,与社交媒体内容相比,显示出显著的领域差异。我们对在现有毒性数据集上训练的模型的系统评估表明,当应用于ToxicChat的这一独特领域时,它们存在不足。我们的工作阐明了在真实的用户-人工智能对话中,毒性检测可能被忽视的挑战。未来,ToxicChat可以成为一种宝贵的资源,推动进一步发展,为用户与AI的交互构建一个安全健康的环境。%R 10.18653/v1/2023.findings-emnlp.311%U型https://aclantology.org/2023.findings-emnlp.311%U型https://doi.org/10.18653/v1/2023.findings-emnlp.311%电话:4694-4702
降价(非正式)
【毒物聊天:揭示现实世界用户与AI对话中毒物检测的潜在挑战】(https://aclantology.org/2023.findings-emnlp.311)(Lin等人,《2023年调查结果》)
国际计算语言学协会
- Zi Lin、Zihan Wang、Yongqi Tong、Yangkun Wang、俞新国、Yujia Wang和Jingbo Shang。2023有毒聊天:揭示现实世界用户与AI对话中有毒物质检测的潜在挑战.英寸计算语言学协会的发现:EMNLP 2023,第4694–4702页,新加坡。计算语言学协会。