计算机科学>计算与语言
标题: 论大型语言模型在语言教学和评估技术中的应用
摘要: 最近发布的大型语言模型,如PaLM和GPT-4,在大众媒体和公众意识中产生了前所未有的影响,对它们的能力和潜在用途产生了兴奋和恐惧, 并为之前没有受到如此多关注的自然语言处理研究带来了光明。 这些发展为教育技术提供了巨大的希望,在本文中,我们特别关注将大型语言模型纳入人工智能驱动的语言教学和评估系统的潜力。 我们考虑了几个研究领域,并讨论了语言学习者教育技术中生成性人工智能的风险和道德考虑。 总的来说,我们发现较大的语言模型在文本生成方面比以前的模型有了改进,为以前不合理的内容生成开辟了道路。 对于文本生成,必须仔细提示,并且可能需要在准备使用之前重新调整输出。 对于自动评分和语法错误纠正,即在已知基准上检查进度的任务,早期调查表明,大型语言模型本身并没有根据标准评估指标改进最先进的结果。 对于评分,文献中建立的语言特征似乎仍应用于获得最佳表现,而对于错误纠正,可能是模型可以提供替代反馈风格,而这些风格没有用现有方法进行敏感测量。 在所有情况下,都有工作要做,尝试将大型语言模型纳入语言学习者的教育技术中,以便正确了解和报告他们的能力和局限性,并确保减少可预见的风险,如错误信息和有害偏见。