霍帕到胡夫迪内赫奥尔

二级词汇资源/CEFRLex

1.二语产出性词汇-SweLLex

____________________________________________________________

SweLLex描述

膨胀代表瑞典L(左)赚钱的人L(左)语言。在这个项目中,我们创建了一个词汇表,该列表由膨胀体它由收集到电子语料库中的许多第二语言(L2)学习者论文组成。SweLLex中的每个条目都由一个引理和一个半言(POS)组合及其频率计数组成。对于每个条目,可以观察到原始频率和归一化频率,无论是在整个语料库中,还是在每个CEFR级别的频率中(欧洲委员会,2001)。因此,该列表是描述性的,并演示了词汇在CEFR级别上的分布。

SweLLex的可用性允许分析瑞典语二语学习者在文章写作中演示的产出性词汇。它可以观察第二语言发展不同水平的接受性词汇之间的关系,如SVALex列表以及SweLLex中捕获的生产性词汇。此外,我们可以观察到二语写作中的拼写偏差,并尝试使用Levenstein距离作为词级标准化的一种方法。

该列表的直接预期用途可在论文评分算法中预见,该算法用于根据达到的熟练程度对瑞典二语论文进行分类,以及在自动生成练习时,生成适当的练习项目需要目标词汇范围。

清单的进一步完善包括用额外的语法、主题和词典信息丰富清单上的项目;以及指定一个目标级别,在该级别上,单词将被激活。此外,还将建立一个用户友好的网站,在这里可以搜索、下载列表,并在SVALex和SweLLex中比较同一词汇项的分布。

浏览/下载列表在这里

SweLLex是CEFRLex资源

 

出版物

  • Elena Volodina、IldikóPilán、Lorena Llozhi、Baptiste Degrese、Thomas Francois。SweLLex:第二语言学习者的产出性词汇。出现在NLP4CALL&LA.NEALT会议记录系列/Linköping电子会议记录研讨会记录中[pdf格式]
  • David Alfter、Yuri Bizzoni、Anders Agebjörn、Elena Volodina和IldikóPilán。从分布到标签:使用学习者语料库的词汇能力分析。出现在NLP4CALL&LA.NEALT会议记录系列/Linköping电子会议记录研讨会记录中
  • 洛伦娜·洛志(Lorena Llozhi)。2016年膨胀列表。从第二语言学习者的文章中生成的富有成效的词汇表。语言技术硕士论文。哥德堡大学哲学、语言学和科学理论系。

 

2.L2接受列表-SVALex

____________________________________________________________

介绍

该项目建立在2009-2011年凯利项目中所做工作的基础上(https://spraakbanken.guse/eng/kelly),一个由欧盟资助的项目,旨在为商业语言学习工具中使用的9种语言构建以学习者为导向的基于频率的单语和双语单词列表(Kilgarriff等人,2014)。在凯利事件后的这段时间里,我们发现了瑞典清单中的一些弱点,我们打算在本项目中解决这些弱点:

  1. 就CEFR级词汇流而言,列表的有效性;
  2. 每个CEFR级别的相关词汇,即根据CEFR指南应在列表中添加、删除或重新定位哪些词汇?
  3. 根据CEFR主题的特定领域词汇-哪些单词,哪些级别,每个级别多少个?

浏览/下载列表在这里

SVALex是CEFRLex资源

 

项目描述和融资

为了解决这些问题,我们目前的主要步骤包括:

  • 编译基于CEFR的阅读理解文本语料库,COCTAILL公司语料库(2013-2014)
  • 的生成SVALex公司,COCTAILLx针对CEFR级别分级的单词表。该列表反映了不同CEFR水平的词汇分布(2015-2016年)

未来将采取的步骤包括:

  • 将SVALex词汇项流式处理到每个级别的目标/外围词汇中
  • 将SVALex项目与Kelly项目进行比较,以确定重叠和级别一致性,这项工作应产生合并的Kelly-SVALex列表
  • 使用域等信息丰富合并的Kelly-SVALex资源

这项工作由瑞典政府(UGOT)通过资助“凯利验证”试点项目资助;以及语言技术中心(CLT,UGOT)和瑞典语言银行(Sprákbanken,UGOT)。

研究问题

该项目将帮助我们确定基于CEFR-的瑞典语课程的(具体)词汇课程,包括每个级别的学生应该掌握哪些单词和每个级别应该掌握多少单词。生成的列表可以用作训练词汇的工具,例如在Lärka等练习/测试生成器中(https://spraakbanken.gus.l); 测试真实例子(文本和句子)是否适合不同水平的学习者;用于评估二语学习者语言生产中的语言熟练程度等。

出版物

  • Elena Volodina、IldikóPilán、Thomas François和Anaís Tack。2016年,SVALex:en and raspráksordlista graderad enligt CEFR niváer。Svenskans beskrivning会议记录35,哥德堡,2016年。[pdf格式]
  • 托马斯·弗朗索瓦(Thomas François)、埃琳娜·沃洛迪纳(Elena Volodina)、伊尔迪科·皮兰(IldikóPilán)、阿纳伊斯·塔克(Anaís Tack)。SVALex:面向瑞典外语和第二语言学习者的CEFR-graded词汇资源。2016年斯洛文尼亚LREC会议记录。[pdf格式]
  • Pilán、Ildikó、Sowmya Vajjala、Elena Volodina。2015.可读阅读:基于语言复杂性的语言学习材料自动评估。发表于《国际计算语言学与应用杂志》(IJLCA)。[pdf格式]
  • Elena Volodina、IldikóPilán、Stian Rödven Eide和Hannes Heidarson,2014年。你得到的是你所注释的:一个有教学注释的瑞典语作为第二语言的教材语料库。计算机辅助语言学习NLP第三次研讨会论文集。NEALT会议记录系列22/Linköping电子会议记录107:128–144。[pdf格式]

 

3.凯利词表

____________________________________________________________

凯利项目描述在这里.