N个阿拉S公司um:用于抽象叙事总结的大范围数据集

赵超,费兹·布拉赫曼,宋开强,姚文林,黛玉(Dian Yu),斯尼格达·查图尔维迪


摘要
叙事摘要的目的是对叙事进行提炼,以描述其最突出的事件和人物。写一篇叙述的摘要很有挑战性,因为它需要了解事件因果关系和人物行为。为了鼓励这方面的研究,我们提出了NarraSum,一个大规模的叙事摘要数据集。它包含122K个故事,这些故事是从不同类型的电影和电视剧集的摘要中收集的,以及相应的抽象摘要。实验表明,人类与NarraSum上最先进的摘要模型之间存在很大的性能差距。我们希望该数据集将促进未来的总结研究,以及对自然语言理解和生成的更广泛研究。数据集位于https://github.com/zhaochaocs/narrasum。
选集ID:
2022.发现-概述14
体积:
计算语言学协会的发现:EMNLP 2022
月份:
十二月
年份:
2022
地址:
阿拉伯联合酋长国阿布扎比
编辑:
约夫·戈德伯格,佐尔尼萨·科扎列娃,张岳(音)
地点:
调查结果
SIG公司:
出版商:
计算语言学协会
注:
页:
182–197
语言:
网址:
https://aclantology.org/2022.findings-emnlp.14
内政部:
10.18653/v1/2022.查找-emnlp.14
比比键:
引用(ACL):
赵超、费兹·婆罗门、宋开强、姚文林、于殿宇和斯尼格达·查图尔维迪。2022NarraSum:用于抽象叙述性总结的大规模数据集.英寸计算语言学协会的发现:EMNLP 2022,第182-197页,阿拉伯联合酋长国阿布扎比。计算语言学协会。
引用(非正式):
NarraSum:用于抽象叙述性总结的大规模数据集(Zhao等人,《2022年调查结果》)
复制引文:
PDF格式:
https://aclantology.org/2022.findings-emnlp.14.pdf