Hoppa至huvudinnehåll

芬兰图尔库诺达利达第八NLP4CALL

没有DaLiDa2019年9月30日,芬兰图尔库研讨会

林雪平大学新闻发布会:单击此处

ACL程序:单击此处

最佳演示奖颁给:在支持德语扫盲教育的搜索引擎中集成大规模网络数据和精选语料库数据。Sabrina Dittrich、Zarah Weiss、Hannes Schröter、Detmar Meurers


地点

NLP4CALL研讨会与NoDaLiDa 2019年在图尔库。


注册信息

应为研讨会注册至少一名已接受论文的作者。要注册,请转到此第页并遵循说明。


程序

房间:PUB5

08:30 - 09:00   登记处
09:00 - 09:10   开幕式
主席:Elena Volodina
    第1课时
    主席:托马斯·弗朗索瓦
09:10 - 09:35   使用机器学习预测学习者对单个单词的知识。
Drilon Avdiu、Vanessa Bui、Klára PtačinováKlimčconíková[幻灯片]
09:35 - 10:00   通过适应性语言学习系统了解词汇增长。
埃尔玛·柯兹、安德烈亚斯·伯格多夫、丹尼尔·威赫曼、斯特凡·米格、于乔、克里斯蒂安·科尔申恩、托比亚斯·梅森[幻灯片]
10:00 - 10:30   咖啡休息时间
    第2部分
    主席:Egon Stemle
10:30 - 10:50   语言无关的语言学习游戏和高效网格生成的形式主义。
Sylvain Hatier、Arnaud Bey、Mathieu Loiseau[幻灯片]
10:50 - 11:10   总结评估符合简短回答评分。
乌尔里克·帕多·马戈特·米斯凯斯[幻灯片]
11:10 - 12:00   受邀演讲1
使用NLP技术和语料库评估二语读者的语言复杂性。
托马斯·弗朗索瓦[幻灯片]
主席:Elena Volodina
12:00 - 13:15   午餐
    第3部分
    主席:赫伯特·兰格
13:15 - 13:40   致力于自动提高非母语学习者的语言水平。
Eetu Sjöblom的Mathias Creutz[幻灯片]
13:40 - 14:05   西班牙语和葡萄牙语二语的语言特征和熟练程度分类。
Iria del Río
(视频演示)[幻灯片]
14:05 - 14:30   在支持德语扫盲教育的搜索引擎中集成大规模网络数据和精选语料库数据。
Sabrina Dittrich、Zarah Weiss、Hannes Schröter、Detmar Meurers
14:30 - 14:55   教学环境中世界语句子的自动生成和语义分级。
埃克哈德·比克[幻灯片]
15:00 - 15:30   咖啡休息时间
    第4次会议
    主席:David Allter
15:30 - 15:50   非母语语音评估及其一致性实验。
周紫薇(Zuwei Zhou)、Sowmya Vajjala、Seyed Vahid Mirnezami
(视频演示)[幻灯片]
15:50 - 16:10   拼写纠正和任务上下文对智能教学系统中简短答案评估的影响。
Ramon Zai、Florian Nuxol、Kordula De Kuthy、Björn Rudzewitz、Detmar Meurers[幻灯片]
16:10 - 17:00   受邀演讲2
建立公平语言学习者语料库的基础设施。
埃贡·斯特姆勒[幻灯片]
主席:Elena Volodina
17:00 - 17:30   组织和闭幕式上的讲话:
SVALA-第二语言瑞典语的笔名服务[幻灯片]
埃琳娜·沃洛蒂娜
17:30 - 19:00   空闲时间
19:00至20:30   欢迎招待会(奥拉卡图老市政厅2)

 


受邀演讲者

今年,我们很高兴欢迎两位受邀的演讲者:

托马斯·弗朗索瓦,加州大学卢旺分校

托马斯·弗朗索瓦(Thomas François)是UCLouvain(Cental)应用语言学和自然语言处理助理教授。他的工作重点是文本可读性的自动评估、文本的自动简化、复杂单词的识别、商业中的有效沟通以及法语作为专业语言的使用。他是宾夕法尼亚大学IRCS(University of Pennsylvania)的特邀研究员,曾担任富布赖特(Fulbright)和BAEF研究员,后来成为FNRS博士后研究员。他领导过CEFRLex等研究项目(http://cental.uclouvain.be/cerlex/),一个用于外语学习或AMesure的CEFR-graded词典(http://cental.uclouvain.be/amesure网站/),一个支持简单写作的平台。他在法语作为外语的可读性方面的工作获得了2012年ATALA最佳论文奖和2016年TALN2016会议最佳论文奖。

标题:用NLP技术和语料库评估二语读者的语言复杂性

近一个世纪以来,评估母语(L1)和外语(L2)读者的语言复杂性一直是可读性领域的核心。这一研究领域为提高书面交流的可理解性做出了巨大贡献,例如帮助提高了主要报纸、技术手册和行政文件的可读性。然而,可读性模型的局限性早在70年代末就被强调了。这最终导致了基于计算语言学和机器学习技术的新研究途径的调查,以改进传统方法。这些进步,再加上大型语料库的自动调查和文本简化的自动方法,使得开发一系列基于计算机的工具成为可能,以增强二语学习者对文本的访问,并确定文本中复杂的语言形式。

在本报告中,我将总结二语读者语言复杂性自动评估的主要趋势,并重点关注三个研究项目。为了说明可读性方法,将介绍DMesure项目。这是第一个专门为法语读者设计的计算可读性公式。其次,演讲将讨论如何通过CEFRLex来使用语料库评估语言复杂性,这是一个国际项目,为一些主要的欧洲语言提供词汇资源,描述词汇在欧洲语言共同参考框架(CEFR)六个能力水平上的频率分布。这些分布是根据用于第二语言目的的教学材料语料库(如教科书和简化读者)进行估算的。生成的资源已经过手动检查,并且是机器可读和开放许可的。该项目还提供了一个界面,允许根据CEFRLex知识自动评估文本中的难词。第三,Predicomplex项目将说明学习者数据的使用。它包括使用机器学习算法进行词汇知识预测的个性化方法。最后,我将强调与二语学习者语言难度评估相关的一些当前挑战和研究机会。

关键词:可读性,分级词汇资源,计算机辅助语言学习,自然语言处理,复杂词识别。

埃贡·斯特姆勒,尤拉克

Egon Stemle是意大利博尔扎诺Eurac Research应用语言学研究所的研究员。他是一位认知科学家,专注于计算语言学和人工智能融合的领域。他致力于编辑、处理、,和注释语言数据,喜欢与其他科学家一起研究他们的数据,但也可以从网络、计算机媒介传播和社交媒体以及语言学习者那里收集或帮助收集新数据。他提倡开放科学,使研究和数据可供他人参考或在新的研究中重复使用。

标题:建立公平语言学习者语料库的基础设施

近年来,科学研究的再现性对外部利益相关者和研究团体本身都变得越来越重要。他们都要求以研究结果可复制的方式管理和保存收集和用于科学研究的经验数据。为了说明这一点,建立了数据管理的公平指导原则,作为良好数据管理的框架,旨在研究数据的可查找性、可访问性、互操作性和可重用性。自然语言处理及其方法发挥着特殊的作用,它们是处理语言数据的许多其他学科的组成部分:语言语料库通常是活的对象,它们不断地被改进和修订,同时处理工具也定期更新,对于相同的处理步骤,可能会导致不同的结果。在本演示文稿中,我将首先调查CMC语料库,它在一些核心方面与语言学习者语料库相似,以了解其是否符合公平原则,并讨论研究数据在多大程度上存储在数据保存举措的存储库中,如CLARIN、,Zenodo或META-SHARE可以帮助提供公平语料库。其次,我将展示一些现代软件技术,以及它们如何使软件打包、安装和执行的过程,更重要的是,在其整个生命周期中跟踪语料库的过程是可复制的。这反过来又使原始数据的更改可用于许多后续分析。

关键词:研究数据管理,语言学习者语料库,可重用性,公平原则


车间说明

这个计算机辅助语言学习的自然语言处理(NLP)主题是从事自然语言处理和语音技术在CALL系统中的集成以及探索这方面产生的理论和方法问题的研究人员的会议场所。

自然语言处理和语音/对话技术与计算机辅助语言学习(CALL)的结合为CALL工具带来了对语言的“理解”,从而使CALL智能化。这一事实为这一研究领域命名——智能呼叫,ICALL。正如定义所示,除了拥有自然语言处理和/或语音/对话技术的优秀知识外,ICALL研究人员还需要对第二语言习得(SLA)理论和实践以及第二语言教育学和教学法的知识有深入的了解。因此,本研讨会邀请所有与ICALL相关的研究,包括使用NLP丰富工具测试二语习得和教学理论的研究,反之亦然,二语习得理论/教学实践在ICALL工具中建模。

计算机辅助语言学习(NLP4CALL)的自然语言处理(NLP)系列研讨会是研究自然语言处理和语音技术在CALL系统中的集成并探索这方面产生的理论和方法学问题的研究人员的会议场所。

后者一方面包括第二语言习得(SLA)研究的启示,另一方面通过建立第二语言研究基础设施促进“计算SLA”的发展。

自然语言处理(或语言技术/计算语言学)和语音技术与计算机辅助语言学习(CALL)的结合为CALL工具带来了对语言的“理解”,从而使CALL智能化。这一事实为这一研究领域命名——智能呼叫,ICALL。正如定义所示,除了拥有自然语言处理和/或语音技术方面的丰富知识外,ICALL研究人员还需要对第二语言习得理论和实践以及第二语言教育学和教学法方面的知识有深入的了解。因此,本次研讨会邀请了一系列与ICALL相关的研究,包括使用NLP丰富工具测试二语习得和教学理论的研究,反之亦然,二语习得理论、教学实践或实证数据在ICALL工具中建模。

NLP4CALL研讨会系列旨在汇集这些领域的能力,以分享经验并围绕该领域的未来进行头脑风暴。

我们欢迎报纸:

  • 描述直接针对ICALL的研究;
  • 展示或讨论现有语言和语音技术或资源在语言学习中的实际使用或潜在使用;
  • 描述了ICALL中潜在使用的资源和工具的持续开发,可以直接用于交互式应用程序,也可以间接用于材料、应用程序或课程开发,例如学习材料的生成、学习者文本/回答的评估、个性化学习解决方案、反馈的提供;
  • 讨论ICALL面临的挑战和/或研究议程;
  • 描述语言学习者数据的实证研究

特别关注已建立和即将建立的针对二语习得和学习者语料库研究的基础设施,包括数据收集、法律问题、注释可靠性、注释工具开发、与二语习得相关数据的搜索环境等问题。

我们鼓励主要但不限于北欧语言的论文演示和软件演示来描述上述主题。


提交信息

今年的研讨会将使用NoDaLiDa 2019模板。包含LaTeX模板和Word模板的作者工具包可以从以下位置下载:

重要信息:对于提交,请将占位符作者保留在LaTeX模板中,因为此模板不会自动匿名化作者姓名。

邀请作者提交长的论文(8-12页)短的演示论文(4-7页),页数不包括参考文献。请在提交时注明一种相关的纸张类型。只接受pdf文件。提交文件将通过电子会议管理系统进行管理Easy椅子。接受论文的最终相机可读版本将额外提供一页,以发表评论。

论文应描述未发表的原创作品或工作成果。每一篇论文都将由至少2名项目委员会成员审查。由于审核是盲目的,请确保论文是匿名的。应该避免使用透露作者身份的自我参照,例如“我们之前展示过(Smith,1991)……”。相反,使用诸如“Smith previous show(Smith,1991)…”这样的引文。提交材料将根据适当性、清晰度、独创性/创新性、正确性/稳健性、有意义的比较、重要性和想法或结果的影响进行评判。

所有被接受的论文都将被收集到一个会议卷中,以提交NEALT会议记录系列(Linköping Electronic Conference proceedings)出版,此外,根据以往研讨会的经验,如第7次NLP4CALL.

重要信息:出于许可的原因,所有摄影师可读的论文应在论文的第一页上包含以下句子作为无标记(无编号)脚注:本作品根据Creative Commons Attribution 4.0国际许可证授权。许可证详细信息:http://creativecommons.org/licenses/by/4.0/.


重要日期:

  • 3月25日,星期一:首次征集论文
  • 4月29日,星期一:第二次征集论文
  • 5月20日,星期一:第三次论文征集
  • 6月24日,星期一:论文最后点名
  • 6月30日,星期日 延期:7月7日,星期日:论文提交截止日期(长、短和演示)
  • 8月18日,周日:接受通知
  • 9月6日,星期五:即将出版的摄影报道
  • 9月30日,星期一:车间日期


项目委员会(初步):

  • Lars Ahrenberg,瑞典林雪平大学
  • David Allter,瑞典哥德堡大学
  • Lisa Beinborn,荷兰阿姆斯特丹大学
  • 埃克哈德·比克,丹麦南丹麦大学
  • Lars Borin,瑞典哥德堡大学
  • 葡萄牙里斯本大学António Branco
  • Jill Burstein,美国教育测试服务中心
  • 安德鲁·凯恩斯,英国剑桥大学
  • 西蒙·多布尼克,瑞典哥德堡大学
  • 托马斯·弗朗索瓦,比利时UCLouvain
  • 瑞典哥德堡大学约翰内斯·格拉恩
  • Andrea Horbach,德国杜伊斯堡大学
  • Herbert Lange,哥德堡大学和查尔默斯理工大学,瑞典
  • John Lee,中国香港城市大学
  • Peter Ljunglöf,哥德堡大学和查尔默斯理工大学,瑞典
  • Montse Maritxalar,西班牙巴斯克大学
  • 瑞典乌普萨拉大学Beata Megyesi
  • 德国图宾根大学Detmar Meurers
  • IldikóPilán,中国香港城市大学
  • MartíQuixal,西班牙加泰罗尼亚大学
  • 罗伯特·雷诺兹,美国杨百翰大学
  • Gerold Schneider,瑞士苏黎世大学
  • Irina Temnikova,保加利亚索非亚大学
  • 科妮莉亚·茨奇霍尔德(Cornelia Tschichold),英国斯旺西大学
  • Francis M.Tyers,美国布卢明顿印第安纳大学
  • Sowmya Vajjala,加拿大国家研究委员会
  • Elena Volodina,瑞典哥德堡大学
  • Mats Wirén,瑞典斯德哥尔摩大学
  • 维多利亚·亚涅娃,英国伍尔弗汉普顿大学
  • Torsten Zesch,德国杜伊斯堡大学
  • 瑞典斯德哥尔摩大学罗伯特·奥斯汀


研讨会组织者

  • 大卫·阿尔弗特哥德堡大学瑞典语系斯普拉克班肯;david dot alfter在svenska dot gu dot se(组织主席)
  • 埃琳娜·沃洛蒂娜哥德堡大学瑞典语系斯普拉克班肯;埃琳娜·多特·沃洛蒂娜(elena dot volodina)在斯文斯卡·多特·古·多特·塞(svenska dot gu dot se)
  • 伊尔迪科·皮兰香港城市大学;ildiko dot pilan在gmail dot com
  • 赫伯特·兰格瑞典哥德堡大学和查尔默斯理工大学计算机科学与工程系;cse的herbert dot lange dot gu dot se
  • 拉尔斯·博林哥德堡大学瑞典语系斯普拉克班肯;拉斯·多特·博林在斯文斯卡·多特·古·多特·塞

本次研讨会之前,由智能计算机辅助语言学习特别兴趣小组组织了一系列关于NLP for CALL的研讨会(SIG-ICALL公司NEALT)。研讨会系列之前由语言技术中心在哥德堡大学。

 

我们打算继续这一系列研讨会,这是迄今为止在北欧国家唯一与ICALL相关的经常性活动。我们的目的是将该系列研讨会与斯堪的纳维亚的两大LT活动(SLTC和Nodalida)联合举办,从而使该研讨会成为年度活动。通过这次研讨会,我们打算介绍ICALL在北欧国家的研究情况,并为活跃在该领域的研究人员提供传播场所。


相关链接

 

ICALL相关邮件列表

有两个邮件列表传播与ICALL相关的信息:一个由EuroCALL/CALICO SIG-ICALL组运行(nlpcall@artsservices.uwaterloo.ca//nlpcall@watarts.uwaterloo.ca)另一个由BEA-workshop组织者运营(bea.nlp.workshop@gmail.com). 我们鼓励您与他们一起了解该领域的最新活动、出版物和讨论

  • 要加入EuroCALL/CALICO列表,请联系Mathias Schulze(mschulze@uwaterloo.ca)。当你想发布一些文件/信息或提出问题时,你可以自由地向EuroCALL/CALICO列表写信。
  • 要加入BEA列表,请联系Ekaterina Kochmar(叶卡捷琳娜·科奇马尔@cl.cam.ac.uk)。BEA邮件列表每年以摘要形式传播信息约4次。

有关NLP4CALL查询,请发送电子邮件至David Allter(戴维·多特·阿尔弗特(david dot alfter)在斯文斯卡·多古·多塞(svenska dot gu dot se))