论文摘要

标题 为NLU创建平衡的最新多层语料库
作者 Normunds Gruzitis公司,劳马·普雷特卡尼纳,白坝苏利特,劳拉·里图玛,Gunta Nespore-Berzkalne公司,Arturs Znotins公司彼得里斯·佩肯斯
摘要 本文介绍了为拉脱维亚语创建多层句法和语义注释文本语料库的工作。我们涉及的广泛应用领域是自然语言理解(NLU),而更具体的应用是抽象文本摘要和知识库填充,这是项目行业合作伙伴拉脱维亚信息机构LETA为实现各种媒体监控流程自动化所要求的。多层语料库和下游应用程序都以跨语言的最新表示形式为基础:通用依赖(UD)、框架网(FrameNet)、PropBank和抽象意义表示(AMR)。在本文中,我们特别关注树库和框架库层的连续注释。我们还绘制到最终AMR层以及辅助命名实体和引用注释层的链接。由于我们的目标是为资源较少的语言建立一个中等规模的通用语料库,因此我们考虑的一个重要方面是语料库在体裁、作者和词汇单位方面的多样性和平衡性。
话题 其他,语料库(创建、注释等),语义学
全文 为NLU创建平衡的最新多层语料库
Biptex公司 @诉讼中{GRUZITIS18.935,
author={Normunds Gruzitis、Lauma Pretkalnina、Baiba Saulite、Laura Rituma、Gunta Nespore-Berzkalne、Arturs Znotins和Peteris Paikens},
title=“{为NLU创建一个平衡的最先进的多层语料库}”,
booktitle={第十一届国际语言资源与评价会议(LREC 2018)会议记录},
年份={2018年},
月={2018年5月7日至12日},
地址={日本宫崎骏},
editor={尼科莱塔·卡尔佐拉里(会议主席)、哈立德·乔克里(Khalid Choukri)、克里斯托弗·西埃里(Christopher Cieri)、蒂埃里·德克莱克(Thierry Declerck)、萨拉·戈吉(Sara Goggi)、科伊蒂·哈西达(Koiti Hasida)、Hitoshi Isahara、本特·马加德(Bente Maegaard)、约瑟夫·马里亚尼(Joseph Mariani)、海莱内·马佐(Héène,
publisher={欧洲语言资源协会(ELRA)},
isbn={979-10-95546-00-9},
语言={英语}
  }
技术支持ELDA公司©2018 ELDA/ELRA版权所有