形态丰富语言中外来词的破译与表征

乔治·博特夫艾莉亚·麦卡锡温斯顿·吴大卫·亚罗斯基


摘要
本文对保加利亚语等中等资源语言的现代文本中遇到的词汇外单词的性质进行了详细的基础实证案例研究,并对潜在的单词形成过程进行了多方面的分布分析,这些过程有助于它们的合成翻译、标记、解析,语言建模和其他NLP任务。鉴于外来词(OOV)通常是NLP和机器翻译系统面临的一个关键挑战,尤其是在资源可用性下限方面,通过对这些类型进行详细的手动和自动分类分析,可以获得有用的实用见解以及语体学见解,多维属性,以及多个代表性OOV数据样本的处理潜力。
选集ID:
2022.科林-1.472
体积:
第29届国际计算语言学会议论文集
月份:
十月
年份:
2022
地址:
韩国庆州
编辑:
尼科莱塔·卡尔佐拉里楚仁煌汉萨姆·金詹姆斯·普斯特约夫斯基利奥·瓦纳Key-Sun Choi公司Pum-Mo Ryu公司陈新喜露西娅·多纳泰利恒基佐藤黑一世(Sadao Kurohashi)帕特里齐亚·帕吉奥念文雪Seokhwan Kim先生英云哈姆中和托尼·京吉尔·李恩里科·桑特斯弗朗西斯·邦德Seung-Hoon Na公司
地点:
科林
SIG公司:
出版商:
国际计算语言学委员会
注:
页:
5309–5326
语言:
网址:
https://aclantology.org/2022.coling-1.472
内政部:
比比键:
引用(ACL):
乔治·博特夫(Georgie Botev)、艾丽亚·麦卡锡(Arya D.McCarthy)、温斯顿·吴(Winston Wu)和大卫·亚罗斯基(David Yarowsky)。2022形态丰富语言中外来词的破译与表征.英寸第29届国际计算语言学会议论文集,第5309–5326页,韩国庆州。国际计算语言学委员会。
引用(非正式):
形态丰富语言中外来词的破译与表征(Botev等人,COLING 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.coling-1.472.pdf