跳到主要内容

二语语言复杂性

在第二语言学习环境中的语言复杂性这一标题下,运行了许多大小项目,其中包括:

 

1.二语词汇复杂性

_______________________________________________________________________

(David Allter博士项目,2016-2021年;博士导师:Elena Volodina和Lars Borin)

与部分重叠L2配置文件项目及其实验多字表达式排名

背景

当针对不同熟练程度的学习者自动创建练习时,了解学习者能够处理和不能处理的词汇非常重要。

分级单词表对教材作者、学习词典、可读性评估等也很有用。

研究问题

本研究的目的是将词语与欧洲共同参考框架(CEFR)的目标水平联系起来。指定的CEFR水平应理解为学习者为了理解单词或表达而必须达到的水平。

然而,仅仅列出单词并将其链接到CEFR级别是不够的,因为这样的列表不可能详尽无遗,也就是说,列表中总是会缺少项目。为了解决这个问题,我们采用了列表并应用了机器学习算法,学习将CEFR级别分配给看不见的单词。

此外,区分单词或表达的不同意义也很重要。事实上,一个学习者在同一水平上学习一个单词的所有意义是令人难以置信的。因此,不同的感官可以(并且在大多数情况下应该)被分配不同的CEFR水平。

出版物

  • David Allter、Therese Lindström Tiedemann和Elena Volodina。2019.LEGATO:灵活的词典注释工具。Nodalida 2019,芬兰图尔库。LiUP压力。[pdf格式]
  • David Allter、Lars Borin、IldikóPilán、Therese Lindström Tiedemann、Elena Volodina。2019.从语言学习平台到语言学习研究基础设施。CLARIN-2018年会后卷。LiUP压力。[pdf格式]
  • David Allter和Elena Volodina。(2018). 整体大于部分之和吗?基于语料库的多词表达中词汇复杂性的初步研究。SLTC-2018会议记录,瑞典斯德哥尔摩
  • Allter,David,&Volodina,Elena(2018)《走向单字词汇复杂性预测》。在NAACL-2018第十三届NLP创新应用于建筑教育应用研讨会论文集(第79-88页)[pdf格式]
  • David Allter、Yuri Bizzoni、Anders Agebjörn、Elena Volodina和IldikóPilán。(2016). 从分布到标签:使用学习者语料库进行词汇熟练度分析。2016年11月16日,乌梅奥SLTC计算机辅助语言学习NLP和语言习得NLP联合研讨会会议记录(第130号,第1-7页)。林雪平大学电子出版社。[pdf格式]

 

二语句子与文本可读性

(又称语言复杂性)

_______________________________________________________________________

句子和文本层面的语言复杂性(IldikóPilán博士项目,2013-2018;博士生导师:Elena Volodina和Lars Borin)

背景

对于词典编纂者和第二语言/外语教师来说,选择能够恰当展示感兴趣词汇的真实例子是一个至关重要的问题。目前,人们常常不知道词典示例的选取原则是什么,或者为二语学习者解释新词汇的示例来自哪里。提供示例的一种方式是编造示例——它们就像提出示例的人认为的那样典型,但缺乏真实性。另一种方法是使用一些真实文本的来源,例如语言语料库,并使用协调软件选择示例。对语料库点击设置的唯一约束是目标词在文本跨度中的出现(与句子相反),这使得点击数常常是无数的。在这种情况下,示例是真实的,但选择过程可能会非常繁琐,“候选”示例的质量可能会大不相同。另一种选择是使用一些限制条件自动预选句子,降级不适当的样本。然后向用户提供他或她可以选择的最佳候选样本。排序后的候选句子列表可用于进一步手动或自动选择(或编辑)高质量的句子,从而减少手动预选这些句子的成本和时间。候选示例可用于:字典条目;说明语言学学生的语言特点;为语言学习者举例说明词汇;为二语学习者创建测试项目;要附带电子文本(例如,通过单击未知单词,用户可以看到该单词的另一个用法示例)。排名算法最终可用于测试web文本是否适合纳入语料库。

因此,目标用户群体是词典编纂者、二语教师、语言学教师、测试项目创作者、电子教材设计者和语料库语言学家。

研究问题

在这方面出现的问题是,我们是否能够全面描述和模拟“好例子”。这个问题已经在不同的研究中得到了解决(Kilgariff等人,2008年,Husák 2008年,Kosem等人,2011年,Segler 2007年等),最近甚至将瑞典语作为目标语言(Borin等人,2012a;Volodina等人,2012年;2013年)。我们的出发点是,好例子的参数依赖于语言,需要对每种语言分别进行测试。

与文本可读性相对,句子可读性问题迄今为止还没有任何系统研究。在词典编纂中,示例的质量已经有了很好的记录,但通常描述的参数很难为计算机应用程序建模。在本研究中,我们计划为三个用户群体(词典编纂者、二语教师、语言学教师)挑选出定义句子可读性的参数;并建议一种可读性度量方法,用于测试句子是否适合用户群体。

 

出版物

  • IldikóPilán,Elena Volodina,Lars Borin,2017年。语言学习练习的候选句子选择:从综合框架到实证评估。好未来杂志:学习与教学专刊NLP。第57卷第3期。[预先打印]
  • 伊尔迪科·皮兰。2016.在从语料库中选出的练习项目候选中检测上下文依赖性。2016年在圣地亚哥NAACL举办的第十一届创新使用NLP构建教育应用研讨会会议记录。[pdf格式]
  • Pilán、Ildikó、Sowmya Vajjala、Elena Volodina。2015.可读阅读:基于语言复杂性的语言学习材料自动评估。发表于《国际计算语言学与应用杂志》(IJLCA)。[pdf格式]
  • 伊尔迪科·皮兰(IldikóPilán)、埃琳娜·沃洛迪纳(Elena Volodina)和理查德·约翰逊(Richard Johansson)。2014.第二语言句子级可读性的基于规则和机器学习方法。第九届使用NLP构建教育应用研讨会论文集,ACL 2014。[pdf格式]
  • Pilán,I.Volodina,E.和Johansson,R.(2013)。为语言学习练习自动选择合适的句子。在:20年的欧洲通话:学习过去,展望未来。2013年EUROCALL会议,葡萄牙埃沃拉,会议记录[pdf格式]
  • Elena Volodina、Richard Johansson、Sofie Johansson-Kokkinakis。2012.瑞典语最佳语料库示例的半自动选择:初始算法评估。计算机辅助语言学习中的NLP研讨会。2012年SLTC NLP CALL研讨会会议记录。Linköping电子会议记录80:59-70。[pdf格式]


3.二语作文自动评分与评估

_______________________________________________________________________

IldikóPilán(博士)、David Allter、Elena Volodina与Torsten Zesch合作的项目

问题

学习者作文评分面临着很多挑战,尤其是在手工评估时间和评估员资格方面。只要评估人员受过良好的培训,人的评估就准确可靠。然而,他们的判断也可能受到不同的外部因素的影响,例如饥饿、坏心情、对学习者的消极态度或无聊。同一篇文章可以根据外界对评估者情绪的影响而进行不同的评分。为了避免误判并确保客观性,某些机构已开始通过自动评估作为参考点来补充人为评分?,例如ETS(Burstein 2003,Burstein&Chodorow 2010)。

背景

开发一个自动论文评分(AEG)系统是一项非常重要的任务,它需要依赖由人工评估员手动评分的论文、一组可用于预测成绩或等级的规则和特定特征以及分类算法组成的数据。AEG任务之前已经在许多项目中得到了解决,例如,由怛stling等人(2013)针对瑞典语,Hancke&Meurers(2013)为德语,Burstein&Chodorow(2010)针对英语,Vajjala&Lóo(2014)针对爱沙尼亚语等。怠stlling等人(2013年)研究了瑞典高中论文(大多为L1)并对他们进行了绩效等级(VG、G、IG)评估,而不是按照我们的意图达到第二语言瑞典语的熟练程度。然而,只有在少数情况下,此类系统用于实际评估,并超越了原型开发。

项目描述

数据的可用性对于AEG实验至关重要。我们使用的是SweLL-pilot(Volodina et al.,2016),这是一个由第二语言(L2)瑞典散文组成的语料库,与《欧洲共同参考框架》(COE 2001)定义的达到的水平相联系。我们的实验涵盖了对SweLL论文的自动排序,以预测一篇论文的CEFR水平(A1、A2、B1、B2、C1)。之所以选择CEFR级别,是因为CEFR在欧洲和外部非常有影响力,有许多项目针对CEFR量表的解释(例如Hancke&Meurers,2013;Vajjala&Lóo,2014),然而,对于基于CEFR的L2瑞典语,几乎没有做什么工作。

特征选择是AEG项目中最重要、最耗时的部分。特征可以是独立于语言的,例如n-gram、句子和单词长度,也可以是特定于语言的特征,例如语言模型、外来词(词汇定义为一些词汇或词表)等。我们的实验包括数据的实证分析,为机器学习实验或启发式规则提取相关特征,并用这些特征进行实验以选择最具预测性的规则。我们的目的是测试语言无关模型与语言特定模型,以了解语言特定特征如何改变预测的质量。在这个项目中,我们与杜伊斯堡大学(University of Duisburg-Essen)合作,在那里,Zesch教授的小组正在我们的数据上测试他们的语言无关模型,同时我们开发特定于语言的方法。

对于用户,我们打算建立一个界面,用于评估新文章,并就某些功能组(例如词汇、语法、可读性等)向用户提供反馈。第一个原型已经在开发中(EuroCALL文章+Pilan/Zesch文章)

融资

瑞典语部(UGOT)、瑞典语银行(Sprákbanken,UGOT。

出版物

  • IldikóPilán、Elena Volodina和Torsten Zesch。2016.通过从专家编写的教材中转移语言复杂性模型来预测学习者写作的熟练程度。于2016年在日本大阪举行的第26届国际计算语言学会议(COLING)上发表。[pdf格式]
  • 伊尔迪科·皮兰(IldikóPilán)、埃琳娜·沃洛迪纳(Elena Volodina)和大卫·阿尔弗特(David Allter)。2016.教材文本为语言学习者写作中的语言复杂性分类提供了帮助。发表于《语言复杂性计算语言学(CL4LC)研讨会论文集》,COLING 2016,日本大阪。
  • 伊尔迪科·皮兰(IldikóPilán)、埃琳娜·沃洛迪纳(Elena Volodina)。瑞典学习者文本中语言水平的分类。2016年瑞典乌梅2016年SLTC会议记录
  • Elena Volodina、IldikóPilán、David Alfter。2016年,根据CEFR水平对瑞典学习者论文进行分类。将出现在塞浦路斯2016年EuroCALL会议记录中。