Learned Construction Grammars Converge Across Registers Given Increased Exposure

Jonathan Dunn; Harish Tayyar Madabushi

doi:10.18653/v1/2021.conll-1.21

在暴露程度增加的情况下，习得的构式语法在不同语域中趋同

摘要

本文测量了在对来自不同寄存器的数据进行训练时，暴露程度增加对学习的构造语法是否收敛到共享表示的影响。语域影响结构的频率，有些结构在正式用法中很常见，但在非正式用法中并不常见。我们预计，暴露于不同寄存器的语法归纳算法将获得不同的结构。暴露的增加在多大程度上导致寄存器特定语法的趋同？本文中的实验模拟了12种语言（一半是日耳曼语，一半是罗曼斯语）的语言学习，语料库代表了三个语域（推特、维基百科、网络）。这些模拟随着暴露量的增加而重复，从10万到200万单词，以测量暴露对语法收敛的影响。结果表明，增加暴露确实会导致所有语言的语法趋同。此外，在不断增加的风险敞口中，登记-通用结构的共享核心保持不变。

选集ID：: 2021.续-1.21
体积：: 第25届计算自然语言学习会议记录
月份：: 十一月
年份：: 2021
地址：: 在线
编辑：: 阿里安娜·比萨扎,奥姆里·阿本德
地点：: CoNLL公司
SIG公司：: SIGNLL公司
出版商：: 计算语言学协会
注：
页：: 268–278
语言：
网址：: https://aclantology.org/2021.coll-1.21
内政部：: 10.18653/v1/2021.coll-1.21
比比键：
引用（ACL）：: 乔纳森·邓恩（Jonathan Dunn）和哈里什·塔亚尔·马达布西（Harish Tayyar Madabushi）。2021在暴露程度增加的情况下，习得的构式语法在不同语域中趋同.英寸第25届计算自然语言学习会议记录，第268-278页，在线。计算语言学协会。
引用（非正式）：: 在暴露程度增加的情况下，习得的构式语法在不同语域中趋同（Dunn和Tayyar Madabushi，CoNLL 2021）
复制引文：
PDF格式：: https://aclantology.org/2021.coll-1.21.pdf
视频：: https://aclantology.org/2021.coll-1.21.mp4网址

PDF格式引用搜索视频