使用数据中心方法和即时工程改进形式敏感的机器翻译

Seungjun Lee先生,Hyeonseok Moon公司,Chanjun公园,Heuiseok Lim公司


摘要
在本文中,我们介绍了KU x Upstage团队提交的口语翻译形式控制特别任务,该任务涉及将英语翻译成具有不同语法形式标记的四种语言。我们的方法包括两个主要部分:1)特定于语言的数据驱动方法,以及2)通过使用大规模语言模型和经验性的提示工程生成合成数据。通过调整方法和模型来适应每种语言的独特语言属性,我们观察到,相对于基线,性能显著提高,证实了数据驱动方法的有效性提高。此外,我们设计的即时工程策略产生了优秀的综合翻译实例。
选集ID:
2023.iwslt-1.40年
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
信号
出版商:
计算语言学协会
注:
页:
420–432
语言:
网址:
https://aclantology.org/2023.iwslt-1.40
内政部:
10.18653/v1/2023.iwslt-1.40
比比键:
引用(ACL):
Seungjun Lee、Hyeonseok Moon、Chanjun Park和Heuiseok Lim。2023使用数据中心方法和即时工程改进形式敏感的机器翻译.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第420-432页,加拿大多伦多(同人和在线)。计算语言学协会。
引用(非正式):
使用数据中心方法和即时工程改进形式敏感的机器翻译(Lee等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.40.pdf