Understanding Iterative Revision from Human-Written Text

Wanyu Du; Vipul Raheja; Dhruv Kumar; Zae Myung Kim; Melissa Lopez; Dongyeop Kang

doi:10.18653/v1/2022.acl-long.250

从人写文本中理解迭代修订

杜婉玉,Vipul Raheja公司,德鲁夫·库马尔,金泽明（Zae Myung Kim）,梅丽莎·洛佩兹,Dongyeop Kang公司

摘要

写作本质上是一个战略性、适应性的过程，更重要的是，它是一个迭代过程。写作的一个关键部分是编辑和修改文本。以前关于文本修订的工作侧重于在单个域中定义编辑意图分类法，或开发具有单一编辑粒度级别的计算模型，例如句子级别的编辑，这与人类的修订周期不同。这项工作描述了IteraTeR：第一个大规模、多领域、编辑关注的迭代修订文本标注语料库。特别是，IteraTeR是基于一个新的框架收集的，用于对迭代文本修订进行全面建模，这些修订概括为各种域、编辑意图、修订深度和粒度。当我们合并带注释的编辑意图时，生成性和基于操作的文本修订模型都显著改进了自动评估。通过我们的工作，我们更好地了解了文本修订过程，在编辑意图和写作质量之间建立了重要的联系，从而能够创建不同的语料库来支持迭代文本修订的计算模型。

选集ID：: 2022.acl长250
体积：: 计算语言学协会第60届年会论文集（第一卷：长篇论文）
月份：: 五月
年份：: 2022
地址：: 爱尔兰都柏林
编辑：: 斯玛兰达·穆雷桑,普雷斯拉夫·纳科夫,阿琳·维拉维琴西奥
地点：: 国际计算语言学协会
SIG公司：
出版商：: 计算语言学协会
注：
页：: 3573–3590
语言：
网址：: https://aclantology.org/2022.acl-long.250
内政部：: 10.18653/v1/2022.acl长250
比比键：
引用（ACL）：: 杜婉玉（Wanyu Du）、维普尔·拉赫亚（Vipul Raheja）、德鲁夫·库马尔（Dhruv Kumar）、金泽明（Zae Myung Kim）、梅丽莎·洛佩兹（Melissa Lopez）和康东业（Dongyeop Kang）。2022从人写文本中理解迭代修订.英寸计算语言学协会第60届年会论文集（第一卷：长篇论文），第3573–3590页，爱尔兰都柏林。计算语言学协会。
引用（非正式）：: 从人写文本中理解迭代修订（Du等人，ACL 2022）
复制引文：
PDF格式：: https://aclantology.org/2022.acl-long.250.pdf
视频：: https://aclantology.org/2022.acl-long.250.mp4网站
代码: vipulraheja/迭代程序

PDF格式引用搜索代码视频