@正在进行{江鄂塔-2023脑筋急转弯,title=“{BRAINTEASER}:大型语言模型的横向思维难题”,author=“姜一凡伊利耶夫斯基、菲利普和马、开心和Zhivar Sourati“,editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“2023年自然语言处理实证方法会议记录”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-main.885”,doi=“10.18653/v1/2023.emnlp-main.885”,pages=“14317--14332”,抽象=“语言模型的成功激发了NLP社区关注需要隐含和复杂推理的任务,并依赖于类似人类的常识机制。虽然这种垂直思维任务相对流行,但横向思维难题却很少受到关注。为了弥合这一差距,我们设计了BrainTeaser:一种多重推理-选择问答任务,旨在测试模型{'}展示横向思维和无视默认常识关联的能力。我们设计了一个三步程序来创建第一个横向思维基准,包括数据收集、分心物生成和对抗性示例生成,从而产生1100个具有高质量注释的谜题。为了通过模型评估横向推理的一致性,我们在对问题进行语义和语境重建的基础上对BrainTraser进行了丰富。我们对最先进的教学和常识语言模型进行的实验揭示了人类和模型之间的显著差距,当考虑对抗性格式之间的一致性时,这种差距会进一步扩大。我们提供所有代码和数据,以刺激开发和评估横向思维模型的工作。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“jiang-etal-2023-脑筋急转弯”><标题信息>BRAINTEASER:大型语言模型的横向思维难题</titleInfo><name type=“personal”>一帆<namePart type=“given”>江<namePart type=“family”><角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>Filip文件伊利耶夫斯基<角色>作者</角色></name><name type=“personal”>开心网<namePart type=“family”>马</namePart><角色>作者</角色></name><name type=“personal”>ZhivarSourati公司<角色>作者</角色></name><originInfo><日期发布>2023-12年</日期发布></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>侯达布阿莫尔<角色>编辑器</角色></name><name type=“personal”>胡安皮诺<角色>编辑器</角色></name><name type=“personal”>卡利卡语巴厘岛<角色>编辑器</角色></name><原始信息>计算语言学协会<位置>新加坡</place></originInfo>会议出版物</relatedItem>语言模型的成功激发了NLP社区关注需要隐含和复杂推理的任务,依赖于类似人类的常识机制。虽然这种垂直思维任务相对流行,但横向思维难题却很少受到关注。为了弥补这一差距,我们设计了BrainTranser:一项多项选择题回答任务,旨在测试模型展现横向思维和挑战默认常识联想的能力。我们设计了一个三步程序来创建第一个横向思维基准,包括数据收集、分心物生成和对抗性示例生成,从而产生1100个具有高质量注释的谜题。为了通过模型评估横向推理的一致性,我们在对问题进行语义和语境重建的基础上对BrainTraser进行了丰富。我们使用最先进的教学和常识语言模型进行的实验揭示了人和模型性能之间的巨大差距,当考虑到对抗格式之间的一致性时,这一差距进一步扩大。我们提供所有代码和数据,以刺激开发和评估横向思维模型的工作</摘要><identifier type=“citekey”>jiang-etal-2023-脑筋急转弯10.18653/v1/2023.emnlp-main.885<位置><网址>https://aclantology.org/2023.emnlp-main.885</url></位置><部分>2023-12年<扩展单元=“page”><开始>14317</开始>14332</范围></部分></mods></modsCollection>
%0会议记录%T BRAINTEASER:大型语言模型的横向思维难题%阿江、一帆%菲利浦·A Ilievski%阿玛、开心%苏拉蒂,日瓦尔%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%2023年自然语言处理实证方法会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%F jiang-etal-2023脑筋急转弯%X语言模型的成功激发了NLP社区关注需要隐含和复杂推理的任务,依靠类人的常识机制。虽然这种垂直思维任务相对流行,但横向思维难题却很少受到关注。为了弥合这一差距,我们设计了BrainTaser:一项多项选择问答任务,旨在测试模型展示横向思维和无视默认常识关联的能力。我们设计了一个三步程序来创建第一个横向思维基准,包括数据收集、分心物生成和对抗性示例生成,从而产生1100个具有高质量注释的谜题。为了通过模型评估横向推理的一致性,我们在对问题进行语义和语境重建的基础上对BrainTraser进行了丰富。我们使用最先进的教学和常识语言模型进行的实验揭示了人和模型性能之间的巨大差距,当考虑到对抗格式之间的一致性时,这一差距进一步扩大。我们提供所有代码和数据,以刺激开发和评估横向思维模型的工作。%R 10.18653/v1/2023.emnlp-main.885%U型https://aclantology.org/2023.emnlp-main.885%U型https://doi.org/10.18653/v1/2023.emnlp-main.885%电话14317-14332
降价(非正式)
[BRANTEASER:大型语言模型的横向思维难题](https://aclantology.org/2023.emnlp-main.885)(Jiang等人,EMNLP 2023)
国际计算语言学协会