HIT-MI&T Lab’s Submission to Eval4NLP 2023 Shared Task

Rui Zhang; Fuhai Song; Hui Huang; Jinghao Yuan; Muyun Yang; Tiejun Zhao

doi:10.18653/v1/2023.eval4nlp-1.11

HIT公司-医疗保险&T型实验室提交给E类值4自然语言处理2023共享任务

Rui Zhang（张瑞）,福海松,Hui Huang（黄慧）,袁敬浩,杨慕云,赵铁军

摘要

最近，大型语言模型（LLM）推动了自然语言处理的研究，并在许多领域显示出令人印象深刻的能力，包括机器翻译评估。本文介绍了我们为Eval4NLP2023共享任务的机器翻译评估子任务开发的方法。基于所提供的LLM，我们提出了一种基于生成的方法和基于概率的方法来进行评估，探索了在选择上下文学习演示时的不同策略，并尝试了不同的集成方法来进一步提高评估准确性。在开发集和测试集上的实验结果证明了该方法的有效性。

选集ID：: 2023.评估nlp-1.11
体积：: NLP系统评估和比较第四次研讨会会议记录
月份：: 十一月
年份：: 2023
地址：: 印尼巴厘岛
编辑：: 丹尼尔·多伊奇,Rotem Dror公司,斯特芬·埃格尔,杨高,克里斯托夫·莱特,尤里·奥皮茨,安德烈亚斯·吕克雷
场馆：: 评估4NLP|WS公司
SIG公司：
出版商：: 计算语言学协会
注：
页：: 139–148
语言：
网址：: https://aclantology.org/2023.eval4nlp-1.11
内政部：: 10.18653/v1/2023.eval4nlp-1.11版本
比比键：
引用（ACL）：: 张瑞、宋福海、黄慧、袁敬浩、杨慕云、赵铁军。2023HIT-MI&T实验室提交给Eval4NLP 2023共享任务.英寸NLP系统评估和比较第四次研讨会会议记录，第139-148页，印度尼西亚巴厘岛。计算语言学协会。
引用（非正式）：: HIT-MI&T实验室提交给Eval4NLP 2023共享任务（Zhang等人，评估4NLP-WS 2023）
复制引文：
PDF格式：: https://aclantology.org/2023.eval4nlp-1.11.pdf

PDF格式引用搜索