结合专家知识和频率信息进行推理欧洲经济论坛单词的级别

爱丽丝·平塔德托马斯·弗朗索瓦


摘要
在二语词汇习得中,传统的目标设定方法要么依赖于从大型母语语料库中获得的词表,要么依赖于二语专家、教师和考官的集体知识和经验。众所周知,这两种方法都有一些优点,但也有一些局限性。在本文中,我们尝试结合两种信息来源,即法语官方参考水平描述和FLElex词汇数据库。我们的目标是训练一个关于法语RLD的统计模型,该模型能够将来自FLElex的分布信息转换为欧洲语言共同参考框架(CEFR)的六个级别之一。我们表明,与CEFRLex项目中当前使用的方法相比,这种方法的精确度提高了29%。此外,我们的实验还对两种传统信息来源(频率与专家知识)的优缺点提供了更深入的见解。
选集ID:
2020.读-1.13
体积:
第一次工具和资源研讨会会议记录,以赋予具有REAding DIfficulties的人权力(READI)
月份:
五月
年份:
2020
地址:
法国马赛
编辑:
努里亚庆典罗德里戈·威尔肯斯
地点:
阅读
信号:
出版商:
欧洲语言资源协会
注:
页:
85–92
语言:
英语
网址:
https://aclantology.org/2020.readi-1.13
内政部:
比比键:
引用(ACL):
爱丽丝·平塔德和托马斯·弗朗索瓦。2020结合专家知识和频率信息推断单词的CEFR水平.英寸第一次工具和资源研讨会会议记录,以赋予具有REAding DIfficulties的人权力(READI),第85-92页,法国马赛。欧洲语言资源协会。
引用(非正式):
结合专家知识和频率信息推断单词的CEFR水平(品塔尔和弗朗索瓦,READI 2020)
复制引文:
PDF格式:
https://aclantology.org/2020.readi-1.13.pdf