常识推理的生成知识提示

刘嘉诚,Alisa Liu(Alisa刘),西明路,肖恩·韦莱克,彼得·韦斯特,Ronan Le运动内衣,蔡叶进(Yejin Choi),Hannaneh Hajishirzi公司


摘要
合并外部知识是否有利于常识推理,同时保持预处理序列模型的灵活性,这仍然是一个悬而未决的问题。为了研究这个问题,我们开发了生成知识提示,它包括从语言模型生成知识,然后在回答问题时提供知识作为附加输入。我们的方法不需要对知识集成进行特定任务的监督,也不需要访问结构化的知识库,但它在四个常识推理任务上提高了大规模、最先进模型的性能,在数字常识(NumerSense)、一般常识(CommonsenseQA 2.0)、,和科学常识(QASC)基准。生成的知识提示突出了大规模语言模型作为改进常识推理的外部知识的灵活来源。我们的代码可在github.com/liujch1998/GKP
选集ID:
2022.acl长225
体积:
计算语言学协会第60届年会论文集(第一卷:长篇论文)
月份:
五月
年份:
2022
地址:
爱尔兰都柏林
编辑:
斯玛兰达·穆雷桑,普雷斯拉夫·纳科夫,阿琳·维拉维琴西奥
地点:
国际计算语言学协会
SIG公司:
出版商:
计算语言学协会
注:
页:
3154–3169
语言:
网址:
https://aclantology.org/2022.acl-long.225
内政部:
10.18653/v1/2022.acl长度225
比比键:
引用(ACL):
刘嘉诚、刘爱丽莎、卢西明、肖恩·威利克、彼得·韦斯特、罗南·勒布拉斯、蔡叶锦和汉娜妮·哈吉什尔兹。2022常识推理的生成知识提示.英寸计算语言学协会第60届年会论文集(第一卷:长篇论文),第3154–3169页,爱尔兰都柏林。计算语言学协会。
引用(非正式):
常识推理的生成知识提示(刘等人,ACL 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.acl-long.225.pdf
视频:
 https://aclantology.org/2022.acl-long.225.mp4
代码
柳奇1998/gkp
数据
通用QA概念网数字感应质量保证服务中心