资源不足语言的跨语言链接发现

迈克尔·罗斯纳,西纳·艾哈迈迪,埃琳娜·西莫娜·阿波斯托尔,朱莉娅·博斯克·吉尔,克里斯蒂安·奇亚尔科斯,米兰·多伊奇诺夫斯基,Katerina Gkirtzou女士,格拉西亚,达格马尔·格罗曼,查亚·利贝斯金德,吉尔德·瓦尔·奈特,吉尔斯·塞拉塞特,西普里安-奥克塔维亚特鲁瓦


摘要
在本文中,我们概述了当前的跨语言链接发现技术,并讨论了它们在资源不足语言中应用的挑战、经验和前景。我们首先介绍跨语言链接和相关技术的目标,特别是应用于语言数据的链接数据范式(Bizer等人,2011)在这一背景下可以发挥的作用。我们定义了一些源代码不足的语言,特别关注互联网上积极使用的语言,即具有数字多功能演讲者社区的语言,但在语言技术方面的支持有限。我们认为,对于有大量文本数据和(至少)双语单词表的语言,跨语言链接技术可以很容易地应用,并且,通过本地化和调整现有技术和资源,这些技术和资源能够为资源不足的语言实现下游应用程序。
选集ID:
2022.lrec-1.20年
体积:
第十三届语言资源与评价会议记录
月份:
六月
年份:
2022
地址:
法国马赛
编辑:
尼科莱塔·卡尔佐拉里,弗雷德里克·贝歇(Frédéric Béchet),菲利普·布莱切,哈立德·乔克里,克里斯托弗·西埃里,蒂埃里·德克勒克,萨拉·戈吉,Hitoshi Isahara先生,本特·梅加德,约瑟夫·马里亚尼,赫莱内·马佐,简·奥迪克,Stelios Piperidis公司
地点:
LREC公司
SIG公司:
出版商:
欧洲语言资源协会
注:
页:
181–192
语言:
网址:
https://aclantology.org/2022.lrec-1.20
DOI(操作界面):
比比键:
引用(ACL):
迈克尔·罗斯纳(Michael Rosner)、西纳·艾哈迈迪(Sina Ahmadi)、埃琳娜·西莫娜·阿波斯托尔(Elena-Simona Apostol)、朱莉娅·博斯克·吉尔(Julia Bosque-Gil)、克里斯蒂安·齐亚科斯(Christian Chiarcos)、米兰·多吉诺夫斯基(Milan Dojchinovski)、卡特琳娜·格尔佐(Katerina Gkirtzou)、豪尔赫·格拉西亚(Jorge Gracia)、达格马尔·格罗曼(Dagmar Gromann。2022资源不足语言的跨语言链接发现.英寸第十三届语言资源与评价会议记录,第181-192页,法国马赛。欧洲语言资源协会。
引用(非正式):
资源不足语言的跨语言链接发现(Rosner等人,LREC 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.lrec-1.20.pdf