On the application of Large Language Models for language teaching and assessment technology

Caines, Andrew; Benedetto, Luca; Taslimipoor, Shiva; Davis, Christopher; Gao, Yuan; Andersen, Oeistein; Yuan, Zheng; Elliott, Mark; Moore, Russell; Bryant, Christopher; Rei, Marek; Yannakoudakis, Helen; Mullooly, Andrew; Nicholls, Diane; Buttery, Paula

计算机科学>计算与语言

arXiv:2307.08393（cs）

【于2023年7月17日提交】

标题：论大型语言模型在语言教学和评估技术中的应用

作者：安德鲁·凯恩斯,卢卡·贝内代托,湿婆·塔斯利米波,克里斯托弗·戴维斯,袁高,奥斯汀·安徒生,郑元,欧立德,罗素穆尔,克里斯托弗·布莱恩特,马雷克雷,海伦·扬纳库达基斯,安德鲁·马洛利,黛安·尼科尔斯,保拉·巴特里

查看PDF

摘要：最近发布的大型语言模型，如PaLM和GPT-4，在大众媒体和公众意识中产生了前所未有的影响，对它们的能力和潜在用途产生了兴奋和恐惧，并为之前没有受到如此多关注的自然语言处理研究带来了光明。这些发展为教育技术提供了巨大的希望，在本文中，我们特别关注将大型语言模型纳入人工智能驱动的语言教学和评估系统的潜力。我们考虑了几个研究领域，并讨论了语言学习者教育技术中生成性人工智能的风险和道德考虑。总的来说，我们发现较大的语言模型在文本生成方面比以前的模型有了改进，为以前不合理的内容生成开辟了道路。对于文本生成，必须仔细提示，并且可能需要在准备使用之前重新调整输出。对于自动评分和语法错误纠正，即在已知基准上检查进度的任务，早期调查表明，大型语言模型本身并没有根据标准评估指标改进最先进的结果。对于评分，文献中建立的语言特征似乎仍应用于获得最佳表现，而对于错误纠正，可能是模型可以提供替代反馈风格，而这些风格没有用现有方法进行敏感测量。在所有情况下，都有工作要做，尝试将大型语言模型纳入语言学习者的教育技术中，以便正确了解和报告他们的能力和局限性，并确保减少可预见的风险，如错误信息和有害偏见。

评论：	在AIED2023研讨会上接受：通过LLM增强教育能力-下一代Gen界面和内容生成
学科：	计算与语言（cs.CL）; 机器学习（cs.LG）
引用为：	arXiv公司：2307.08393【cs.CL】
	（或 arXiv:2307.08393v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2307.08393

提交历史记录

发件人：Luca Benedetto[查看电子邮件]
[第1版]2023年7月17日星期一11:12:56 UTC（179 KB）

计算机科学>计算与语言

标题：论大型语言模型在语言教学和评估技术中的应用

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：论大型语言模型在语言教学和评估技术中的应用

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目