HIT公司-医疗保险&T型实验室提交给E类值4自然语言处理2023共享任务

Rui Zhang(张瑞),福海松,Hui Huang(黄慧),袁敬浩,杨慕云,赵铁军


摘要
最近,大型语言模型(LLM)推动了自然语言处理的研究,并在许多领域显示出令人印象深刻的能力,包括机器翻译评估。本文介绍了我们为Eval4NLP2023共享任务的机器翻译评估子任务开发的方法。基于所提供的LLM,我们提出了一种基于生成的方法和基于概率的方法来进行评估,探索了在选择上下文学习演示时的不同策略,并尝试了不同的集成方法来进一步提高评估准确性。在开发集和测试集上的实验结果证明了该方法的有效性。
选集ID:
2023.评估nlp-1.11
体积:
NLP系统评估和比较第四次研讨会会议记录
月份:
十一月
年份:
2023
地址:
印尼巴厘岛
编辑:
丹尼尔·多伊奇,Rotem Dror公司,斯特芬·埃格尔,杨高,克里斯托夫·莱特,尤里·奥皮茨,安德烈亚斯·吕克雷
场馆:
评估4NLP|WS公司
SIG公司:
出版商:
计算语言学协会
注:
页:
139–148
语言:
网址:
https://aclantology.org/2023.eval4nlp-1.11
内政部:
10.18653/v1/2023.eval4nlp-1.11版本
比比键:
引用(ACL):
张瑞、宋福海、黄慧、袁敬浩、杨慕云、赵铁军。2023HIT-MI&T实验室提交给Eval4NLP 2023共享任务.英寸NLP系统评估和比较第四次研讨会会议记录,第139-148页,印度尼西亚巴厘岛。计算语言学协会。
引用(非正式):
HIT-MI&T实验室提交给Eval4NLP 2023共享任务(Zhang等人,评估4NLP-WS 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.eval4nlp-1.11.pdf