NarraSum: A Large-Scale Dataset for Abstractive Narrative Summarization

Chao Zhao; Faeze Brahman; Kaiqiang Song; Wenlin Yao; Dian Yu; Snigdha Chaturvedi

doi:10.18653/v1/2022.findings-emnlp.14

N个阿拉S公司um：用于抽象叙事总结的大范围数据集

赵超,费兹·布拉赫曼,宋开强,姚文林,黛玉（Dian Yu）,斯尼格达·查图尔维迪

摘要

叙事摘要的目的是对叙事进行提炼，以描述其最突出的事件和人物。写一篇叙述的摘要很有挑战性，因为它需要了解事件因果关系和人物行为。为了鼓励这方面的研究，我们提出了NarraSum，一个大规模的叙事摘要数据集。它包含122K个故事，这些故事是从不同类型的电影和电视剧集的摘要中收集的，以及相应的抽象摘要。实验表明，人类与NarraSum上最先进的摘要模型之间存在很大的性能差距。我们希望该数据集将促进未来的总结研究，以及对自然语言理解和生成的更广泛研究。数据集位于https://github.com/zhaochaocs/narrasum。

选集ID：: 2022.发现-概述14
体积：: 计算语言学协会的发现：EMNLP 2022
月份：: 十二月
年份：: 2022
地址：: 阿拉伯联合酋长国阿布扎比
编辑：: 约夫·戈德伯格,佐尔尼萨·科扎列娃,张岳（音）
地点：: 调查结果
SIG公司：
出版商：: 计算语言学协会
注：
页：: 182–197
语言：
网址：: https://aclantology.org/2022.findings-emnlp.14
内政部：: 10.18653/v1/2022.查找-emnlp.14
比比键：
引用（ACL）：: 赵超、费兹·婆罗门、宋开强、姚文林、于殿宇和斯尼格达·查图尔维迪。2022NarraSum：用于抽象叙述性总结的大规模数据集.英寸计算语言学协会的发现：EMNLP 2022，第182-197页，阿拉伯联合酋长国阿布扎比。计算语言学协会。
引用（非正式）：: NarraSum：用于抽象叙述性总结的大规模数据集（Zhao等人，《2022年调查结果》）
复制引文：
PDF格式：: https://aclantology.org/2022.findings-emnlp.14.pdf

PDF格式引用搜索