在暴露程度增加的情况下,习得的构式语法在不同语域中趋同

乔纳森·邓恩,哈里什·塔亚尔·马达布西


摘要
本文测量了在对来自不同寄存器的数据进行训练时,暴露程度增加对学习的构造语法是否收敛到共享表示的影响。语域影响结构的频率,有些结构在正式用法中很常见,但在非正式用法中并不常见。我们预计,暴露于不同寄存器的语法归纳算法将获得不同的结构。暴露的增加在多大程度上导致寄存器特定语法的趋同?本文中的实验模拟了12种语言(一半是日耳曼语,一半是罗曼斯语)的语言学习,语料库代表了三个语域(推特、维基百科、网络)。这些模拟随着暴露量的增加而重复,从10万到200万单词,以测量暴露对语法收敛的影响。结果表明,增加暴露确实会导致所有语言的语法趋同。此外,在不断增加的风险敞口中,登记-通用结构的共享核心保持不变。
选集ID:
2021.续-1.21
体积:
第25届计算自然语言学习会议记录
月份:
十一月
年份:
2021
地址:
在线
编辑:
阿里安娜·比萨扎,奥姆里·阿本德
地点:
CoNLL公司
SIG公司:
SIGNLL公司
出版商:
计算语言学协会
注:
页:
268–278
语言:
网址:
https://aclantology.org/2021.coll-1.21
内政部:
10.18653/v1/2021.coll-1.21
比比键:
引用(ACL):
乔纳森·邓恩(Jonathan Dunn)和哈里什·塔亚尔·马达布西(Harish Tayyar Madabushi)。2021在暴露程度增加的情况下,习得的构式语法在不同语域中趋同.英寸第25届计算自然语言学习会议记录,第268-278页,在线。计算语言学协会。
引用(非正式):
在暴露程度增加的情况下,习得的构式语法在不同语域中趋同(Dunn和Tayyar Madabushi,CoNLL 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.coll-1.21.pdf
视频:
 https://aclantology.org/2021.coll-1.21.mp4网址