霍帕到胡夫迪内赫奥尔

L2数据

1.COCTAILL——瑞典第二语言教材语料库

____________________________________________________________________

自2001年接受《欧洲共同语言参考框架》(CEFR)(欧洲委员会,2001年)以来,欧洲内外的许多国家都放弃了以前的第二语言教学和评估实践,转而支持CEFR。CEFR量表由6个熟练程度组成,有意模糊描述,以适应不同语言的多样性。因此,研究人员和教育工作者中有声音要求明确解释每种语言在所需词汇范围、语法能力等方面的每种熟练程度(Byrnes 2007;Little 2007;Lightle 2011;Milton 2009;North 2007;Westhoff 2007)。

众所周知,CEFR“can-do”语句可以为不同语言和目标群体提供灵活的解释。然而,它们是非特定的,因此很难将学习者为了完成不同CEFR水平的交际任务而需要的不同类型的能力和准确性水平联系起来。为了解决这个问题,需要对每种语言进行系统研究,包括“输入”规范性文本和“输出”学习者产生的文本。在这个项目中,我们采取了第一步,收集和研究瑞典语的规范性文本,我们将其定义为用于阅读理解的文本,例如教材中使用的文本。

汇编这样一个语料库背后的研究议程包括对规范性“输入”文本的研究,这些文本可以揭示在显性语法、接受性词汇、文本和句子可读性方面所教内容的一些事实;以及深入了解规范性文本的语言特征,这有助于预测学习者在课堂和测试环境中的主动词汇、语法能力等方面的表现。

主要研究问题如下:

  • 在每一个特定的CEFR层面上,哪些语言方面是重要的,为什么?哪一个是级别复杂性最可靠的“预测因子”?这些方面将分别从文本和句子层面进行研究
  • 如何自动识别不同主题域的文本?在主题识别中,哪些是最可靠的语言参数?
  • 学生最常接触哪些接受性词汇,因此哪些单词和每个级别需要学习多少单词很重要?
  • 哪些语法学生最容易接触到并因此成为每个特定级别额外培训的重点?

在2013-2014年期间,收集、扫描、OCR-ed、手动检查和注释教学和文本特征,并自动注释语言特征,语料库包含约4本CEFR 5级(A1、A2、B1、B2和C1)的每级教材。语言技术中心,http://clt.gu.se/)瑞典语银行(Sprákbanken)和瑞典语部(网址:http://svenska.gu.se/)哥德堡大学(UGOT)资助了这项工作。

 

与COCTAILL相关的出版物

  • 托马斯·弗朗索瓦(Thomas François)、埃琳娜·沃洛迪纳(Elena Volodina)、伊尔迪科·皮兰(IldikóPilán)、阿纳伊斯·塔克(Anaís Tack)。2016年。SVALex:面向瑞典外语和第二语言学习者的CEFR-graded词汇资源。将出现在斯洛文尼亚2016年LREC会议记录中。[pdf格式]
  • Elena Volodina、IldikóPilán、Thomas François和Anaís Tack。2016年,SVALex:en and raspráksordlista graderad enligt CEFR niváer。Svenskans beskrivning会议记录35,哥德堡,2016年。[pdf格式]
  • 伊尔迪科·皮兰。从语料库中选出的候选练习项目中检测上下文相关性。2016年在圣地亚哥NAACL举办的第十一届创新使用NLP构建教育应用研讨会会议记录。[pdf格式]
  • Pilán、Ildikó、Sowmya Vajjala、Elena Volodina。2015.可读阅读:基于语言复杂性的语言学习材料自动评估。发表于《国际计算语言学与应用杂志》(IJLCA)。[pdf格式]
  • Elena Volodina、IldikóPilán、Stian Rödven Eide和Hannes Heidarson。2014.你得到了你所注释的:瑞典语作为第二语言的教学注释教材语料库。计算机辅助语言学习NLP第三次研讨会论文集。NEALT会议记录系列22/Linköping电子会议记录107:128–144。[pdf格式]
  • 伊尔迪科·皮兰·埃琳娜·沃洛迪纳。2014年,Lärka课程书籍编辑注释指南。弗尔斯文斯卡研究所。[pdf格式]
  • 伊尔迪科·皮兰(IldikóPilán)、埃琳娜·沃洛迪纳(Elena Volodina)和理查德·约翰逊(Richard Johansson)。2014.第二语言句子级可读性的基于规则和机器学习方法。第九届使用NLP构建教育应用研讨会论文集,ACL 2014。[pdf格式]
  • Pilán,I.Volodina,E.和Johansson,R.,2013年。为语言学习练习自动选择合适的句子。在:20年的欧洲通话:学习过去,展望未来。2013年EUROCALL会议,葡萄牙埃沃拉,会议记录[pdf格式]
  • Volodina,E.&Johansson Kokkinakis,S.2013年。编译CEFR-相关文本的语料库。语言测试和CEFR会议记录,比利时安特卫普,2013年5月27日至29日。【pdf,第248-259页】

 

2.SweLL-pilot,瑞典二语学习者论文集

____________________________________________________________________

研究学习者语言发展阶段的需要在语言学习、语言评估、第二语言材料开发等方面是透明的。然而,瑞典第二语言论文缺乏关于语言发展水平的元数据。在这个项目中,我们着手收集、数字化并在语言上注释一系列与CEFR水平(A1、A2、B1、B2、C1)相关的二语论文。这计划是为瑞典语作为第二语言的研究创建电子基础设施的第一步。

提供与CEFR水平相关的学习论文将有助于回答以下问题:

  • 哪些语言方面最可靠地揭示了学生的水平?这将产生一种工具,用于将学习者生成的文本自动链接到相关的CEFR水平,即评估学习者表现和达到的熟练程度(能力)之间的联系
  • 这一水平的学生应该展示哪些产出性词汇。估计的词汇量范围将有助于预测每级(好)瑞典学生可以获得多少单词,从而影响测试实践。
  • 学生能够展示哪些富有成效的语法
  • 另一个研究方向是揭示不同熟练程度的句子和文本可读性的特征

自2013年以来,论文收集工作一直在进行,有几所学校为斯威尔L2文集提供了论文。

如果你愿意协助收集(CEFR-相关)第二语言学习者论文,请联系埃琳娜·沃洛蒂娜电子邮件地址埃琳娜·多特·沃洛蒂娜(elena dot volodina)在斯文斯卡·多特·古·多特·塞(svenska dot gu dot se)

学生在收集论文之前需要签署许可表格。请在此处查找表单:在英语瑞典语

概述社会科学研究伦理原则瑞典研究委员会(瑞典语)的论文中对此进行了描述

 

出版物,膨胀试验相关

  • Elena Volodina、IldikóPilán、Ingegerd Enström、Lorena Llozhi、Peter Lundkvist、Gullög Sundberg、Monica Sandell。增长中的膨胀:用于欧洲参考水平研究的瑞典学习者语言语料库。2016年斯洛文尼亚LREC会议记录。[pdf格式]
  • Elena Volodina、IldikóPilán、Ingegerd Enström、Peter Lundkvist、Gunög Sundberg、Lorena Llozhi、Monica Sandell。2016年,SweLL–en korpus med L2 uppsatser för CEFR研究生。Svenskans beskrivning会议记录35,哥德堡,2016年。[pdf格式]
  • 洛伦娜·洛志(Lorena Llozhi)。2016年度最佳榜单。从第二语言学习者的文章中产生的产出性词汇列表。哥德堡大学语言技术硕士论文。[pdf格式]