计算词源与词汇涌现

温斯顿·吴,大卫·亚罗斯基


摘要
我们开发了一个可扩展的、全面的Wiktionary解析器,它改进了几个现有的解析器。我们预测了Wiktionary中所有词源类型和语言中单词的词源,显示出了超过强大基线的改进。我们还对单词出现进行了建模,并展示了词源学在建模这种现象中的应用。我们发布解析器以进一步研究这个尚未研究的领域。
选集ID:
2020.记录-1.397
体积:
第十二届语言资源与评价会议记录
月份:
五月
年份:
2020
地址:
法国马赛
编辑:
尼科莱塔·卡尔佐拉里,弗雷德里克·贝歇(Frédéric Béchet),菲利普·布莱切,哈立德·乔克里,克里斯托弗·西埃里,蒂埃里·德克勒克,萨拉·戈吉,Hitoshi Isahara先生,本特·梅加德,约瑟夫·马里亚尼,赫莱内·马佐,亚松森·莫雷诺,简·奥迪克,Stelios Piperidis公司
地点:
LREC公司
信号:
出版商:
欧洲语言资源协会
注:
页:
3252–3259
语言:
英语
网址:
https://aclantology.org/2020.lrec-1.397
内政部:
比比键:
引用(ACL):
Winston Wu和David Yarowsky。2020计算词源与词汇涌现.英寸第十二届语言资源与评价会议记录,第3252–3259页,法国马赛。欧洲语言资源协会。
引用(非正式):
计算词源与词汇涌现(Wu&Yarowsky,LREC 2020)
复制引文:
PDF格式:
https://aclantology.org/2020.lrec-1.397.pdf