关于同源生成模型的稳健性

温斯顿·吴,大卫·亚罗斯基


摘要
我们评估了两种流行的神经同源生成模型对几种人类可信噪声(删除、复制、交换和键盘错误,以及一种新型错误,语音错误)的鲁棒性。我们发现,重复和语音替换的危害最小,而其他类型的错误则有害。我们针对每种错误类型对模型的结果进行了深入分析,以解释这些模型的表现方式和原因。
选集ID:
2022.lrec-1.458年
体积:
第十三届语言资源与评价会议记录
月份:
六月
年份:
2022
地址:
法国马赛
编辑:
尼科莱塔·卡尔佐拉里,弗雷德里克·贝歇(Frédéric Béchet),菲利普·布莱切,哈立德·乔克里,克里斯托弗·西埃里,蒂埃里·德克勒克,萨拉·戈吉,Hitoshi Isahara先生,本特·梅加德,约瑟夫·马里亚尼,赫莱内·马佐,简·奥迪克,Stelios Piperidis公司
地点:
LREC公司
SIG公司:
出版商:
欧洲语言资源协会
注:
页:
4299–4305
语言:
网址:
https://aclantology.org/2022.lrec-1.458
内政部:
比比键:
引用(ACL):
Winston Wu和David Yarowsky。2022关于同源生成模型的稳健性.英寸第十三届语言资源与评价会议记录,第4299–4305页,法国马赛。欧洲语言资源协会。
引用(非正式):
关于同源生成模型的稳健性(Wu&Yarowsky,LREC 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.lrec-1.458.pdf