@进行中{cui-etal-2022广义量词,title=“在多语言{NLU}基准中,广义量词是错误的来源”,author=“崔瑞祥赫什科维奇、丹尼尔和S{\o}gaard,Anders“,editor=“Carpuat、Marine和德马内夫、玛丽·凯瑟琳和Meza Ruiz,Ivan Vladimir“,booktitle=“计算语言学协会北美分会2022年会议记录:人类语言技术”,月=七月,年=“2022”,address=“美国西雅图”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.naacl-main.359”,doi=“10.18653/v1/2022.naacl-main.359”,pages=“4875--4893”,abstract=“自19世纪以来,表示语言的逻辑方法已经发展并评估了量词的计算模型,但今天的NLU模型仍然难以捕捉其语义。我们依靠广义量词理论对量词语义进行独立于语言的表示,以量化它们对NLU模型错误的贡献。我们发现量词在NLU基准测试中普遍存在,它们在测试时的出现与性能下降有关。多语言模型也显示出不令人满意的量词推理能力,但对于非英语语言来说不一定更差。为了便于直接目标探测,我们提出了一种对抗性广义量词NLI任务(GQNLI),并表明预训练语言模型在广义量词推理中明显缺乏鲁棒性。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“cui-etal-2022-generalized-quantifiers”><标题信息><title=广义量词是多语言NLU基准中的误差来源</title=</titleInfo><name type=“个人”>瑞祥<namePart type=“given”>崔<namePart type=“family”><角色>作者</角色></name><name type=“个人”>丹尼尔赫什科维奇<角色>作者</角色></name><name type=“个人”>安德斯瑟加德<角色>作者</角色></name><originInfo>2022-07发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会北美分会2022年会议记录:人类语言技术</titleInfo><name type=“个人”><namePart type=“given”>海洋</namePart><namePart type=“family”>卡普瓦特</namePart><角色>编辑器</角色></name><name type=“个人”>玛丽·凯瑟琳马内夫<角色>编辑器</角色></name><name type=“个人”>伊凡弗拉基米尔梅扎·鲁伊斯<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>美国西雅图</place></originInfo>会议出版物</relatedItem>自19世纪以来,表示语言的逻辑方法已经发展并评估了量词的计算模型,但今天的NLU模型仍然难以捕捉其语义。我们依靠广义量词理论对量词语义进行独立于语言的表示,以量化它们对NLU模型错误的贡献。我们发现量词在NLU基准测试中普遍存在,它们在测试时的出现与性能下降有关。多语言模型也显示出不令人满意的量词推理能力,但对于非英语语言来说不一定更差。为了便于直接目标探测,我们提出了一种对抗性广义量词NLI任务(GQNLI),并表明预训练语言模型在广义量词推理中明显缺乏鲁棒性</摘要>cui-etal-2022广义量词10.18653/v1/2022.naacl-main.359<位置><网址>https://aclantology.org/2022.naacl-main.359</url></位置><部分>2022-07年<扩展单元=“page”><开始>4875</开始><end>4893</范围></部分></mods></modsCollection>
%0会议记录%T广义量词在多语言NLU基准测试中的误差来源%阿翠、瑞香%丹尼尔·赫什科维奇%安德斯·索加德%Y Carpuat,海军%Y de Marneffe,玛丽·凯瑟琳%Y Meza Ruiz,伊万·弗拉基米尔%计算语言学协会北美分会2022年会议论文集:人类语言技术%D 2022年%7月8日%计算语言学协会%C美国西雅图%F cui-etal-2022广义量词%自19世纪以来,表示语言的逻辑方法已经发展并评估了量词的计算模型,但今天的NLU模型仍然难以捕捉其语义。我们依靠广义量词理论对量词语义进行独立于语言的表示,以量化它们对NLU模型错误的贡献。我们发现量词在NLU基准测试中普遍存在,它们在测试时的出现与性能下降有关。多语言模型也表现出令人不满意的量词推理能力,但对于非英语语言来说并不一定更差。为了便于直接目标探测,我们提出了一种对抗性广义量词NLI任务(GQNLI),并表明预训练语言模型在广义量词推理中明显缺乏鲁棒性。%R 10.18653/v1/2022.naacl-main.359%U型https://aclantology.org/2022.naacl-main.359%U型https://doi.org/10.18653/v1/2022.naacl-main.359%电话:4875-4893
降价(非正式)
【广义量词是多语言NLU基准中的错误源】(https://acl选集.org/2022.naacl-main.359)(Cui等人,NAACL 2022)
国际计算语言学协会
- 崔瑞祥、丹尼尔·赫什科维奇和安德斯·索加德。2022广义量词是多语言NLU基准测试中的误差源.英寸计算语言学协会北美分会2022年会议记录:人类语言技术,第4875–4893页,美国西雅图。计算语言学协会。