从人写文本中理解迭代修订

杜婉玉,Vipul Raheja公司,德鲁夫·库马尔,金泽明(Zae Myung Kim),梅丽莎·洛佩兹,Dongyeop Kang公司


摘要
写作本质上是一个战略性、适应性的过程,更重要的是,它是一个迭代过程。写作的一个关键部分是编辑和修改文本。以前关于文本修订的工作侧重于在单个域中定义编辑意图分类法,或开发具有单一编辑粒度级别的计算模型,例如句子级别的编辑,这与人类的修订周期不同。这项工作描述了IteraTeR:第一个大规模、多领域、编辑关注的迭代修订文本标注语料库。特别是,IteraTeR是基于一个新的框架收集的,用于对迭代文本修订进行全面建模,这些修订概括为各种域、编辑意图、修订深度和粒度。当我们合并带注释的编辑意图时,生成性和基于操作的文本修订模型都显著改进了自动评估。通过我们的工作,我们更好地了解了文本修订过程,在编辑意图和写作质量之间建立了重要的联系,从而能够创建不同的语料库来支持迭代文本修订的计算模型。
选集ID:
2022.acl长250
体积:
计算语言学协会第60届年会论文集(第一卷:长篇论文)
月份:
五月
年份:
2022
地址:
爱尔兰都柏林
编辑:
斯玛兰达·穆雷桑,普雷斯拉夫·纳科夫,阿琳·维拉维琴西奥
地点:
国际计算语言学协会
SIG公司:
出版商:
计算语言学协会
注:
页:
3573–3590
语言:
网址:
https://aclantology.org/2022.acl-long.250
内政部:
10.18653/v1/2022.acl长250
比比键:
引用(ACL):
杜婉玉(Wanyu Du)、维普尔·拉赫亚(Vipul Raheja)、德鲁夫·库马尔(Dhruv Kumar)、金泽明(Zae Myung Kim)、梅丽莎·洛佩兹(Melissa Lopez)和康东业(Dongyeop Kang)。2022从人写文本中理解迭代修订.英寸计算语言学协会第60届年会论文集(第一卷:长篇论文),第3573–3590页,爱尔兰都柏林。计算语言学协会。
引用(非正式):
从人写文本中理解迭代修订(Du等人,ACL 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.acl-long.250.pdf
视频:
 https://aclantology.org/2022.acl-long.250.mp4网站
代码
vipulraheja/迭代程序