@正在进行{wu-etal-2020-多语言,title=“基于多语言词典的核心词汇构建”,author=“Wu、Winston和尼古莱、加勒特和David Yarowsky“,editor=“Calzolari、Nicoletta和B{\'e}chet、Fr{\'e}d{\'e}ric和Blache、Philippe和Choukri、Khalid和Cieri、Christopher和Declerck、Thierry和戈吉、萨拉和Isahara、Hitoshi和Maegaard、Bente和玛丽亚尼、约瑟夫和Mazo、H{\'e}l{\`e}ne和莫雷诺、亚松森和Odijk、Jan和Piperidis,Stelios“,booktitle=“第十二届语言资源与评估会议论文集”,月份=五月,年=“2020”,address=“法国马赛”,publisher=“欧洲语言资源协会”,url=“https://aclantology.org/2020.lrec-1.519”,pages=“4211--4217”,抽象=“我们基于目标概念在数千个双语词典中的相对覆盖率,为多个应用程序的核心词汇集提出了一种新的功能定义和构建方法。我们根据这些词典一致性方法开发的新核心概念词汇表与现有的广泛实用工具实现了高度重叠针对第一语言和第二语言学习或领域语言学等应用的lized核心词汇表。我们的深入分析说明了我们新提出的核心词汇集的多种理想属性,包括它们的非组合性。我们使用同源预测方法来恢复大规模多语言词典构建中该核心词汇的缺失覆盖率,我们认为,在为包括机器翻译和语言学习在内的多个下游任务创建低资源语言的新词典时,应该优先考虑这些核心词汇,以便启发。",language=“英语”,国际标准图书编号=“979-10-95546-34-4”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“wu-etal-2020-多语言”><标题信息>基于多语言词典的核心词汇构建</titleInfo><name type=“personal”>温斯顿<namePart type=“family”>吴</namePart><角色>作者</角色></name><name type=“personal”>加勒特尼古莱<角色>作者</角色></name><name type=“personal”>大卫雅罗斯基<角色>作者</角色></name><originInfo>发布日期:2020-05发布日期:</originInfo><typeOfResource>文本<语言>英语<languageTerm type=“code”authority=“iso639-2b”>eng英语</语言><relatedItem type=“主机”><标题信息>第十二届语言资源与评估会议记录</titleInfo><name type=“personal”>尼科莱塔卡尔佐拉里<角色>编辑器</角色></name><name type=“personal”><namePart type=“给定”>Frédéric</namePart>贝歇<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>菲利普</namePart>布莱切<角色>编辑器</角色></name><name type=“personal”>哈立德乔克里<角色>编辑器</角色></name><name type=“personal”>克里斯托弗Cieri公司<角色>编辑器</角色></name><name type=“personal”>蒂埃里Declerck公司<角色>编辑器</角色></name><name type=“personal”>萨拉戈吉<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>Hitoshi</namePart><namePart type=“family”>伊萨哈拉</namePart><角色>编辑器</角色></name><name type=“personal”>Bente(本特)梅加德<角色>编辑器</角色></name><name type=“personal”>约瑟夫玛丽亚尼<角色>编辑器</角色></name><name type=“personal”>Hélène<namePart type=“family”>马祖<角色>编辑器</角色></name><name type=“personal”>亚松森莫雷诺<角色>编辑器</角色></name><name type=“personal”>一月奥迪jk<角色>编辑器</角色></name><name type=“personal”>Stelios公司哌啶虫<角色>编辑器</角色></name><originInfo>欧洲语言资源协会<位置>法国马赛</place></originInfo><type-authority=“marcgt”>会议出版物</type>979-10-95546-34-4</relatedItem><摘要>基于目标概念在数千个双语词典中的相对覆盖率,我们提出了一种新的多应用核心词汇集的功能定义和构造方法。我们新开发的核心概念词汇表源自这些词典共识方法,与针对第一语言和第二语言学习或领域语言学等应用的现有广泛使用的核心词汇表高度重叠。我们的深入分析说明了我们新提出的核心词汇集的多种理想属性,包括它们的非组合性。我们采用同源预测方法来恢复大规模多语言词典构建中该核心词汇的缺失覆盖,我们认为,在为包括机器翻译和语言学习在内的多个下游任务创建低资源语言的新词典时,应该优先考虑这些核心词汇,以便启发</摘要>wu-etal-2020多语言<位置><网址>https://aclantology.org/2020.lrec-1.519</url></位置><部分><日期>2020-05</日期><扩展单元=“page”><开始>4211</开始>4217</范围></部分></mods></modsCollection>
%0会议记录%基于T多语词典的核心词汇构建%温斯顿·A Wu%加勒特·尼古拉%A Yarowsky,大卫%尼科莱塔·Y·卡尔佐拉里%Y Béchet,Frédéric%Y Blache,菲利普%哈立德·朱克里%克里斯托弗·西埃里%蒂埃里·德克勒克%Y Goggi,萨拉%Y Isahara,Hitoshi%Y Maegaard,本特%约瑟夫·马里亚尼%耶鲁·马佐%Y Moreno,亚松森%Y Odijk,简%Y Piperidis、Stelios%第十二届语言资源与评价会议论文集%D 2020年%5月8日%I欧洲语言资源协会%C马赛,法国%@ 979-10-95546-34-4%G英语%F wu-etal-2020多语言%基于目标概念在数千个双语词典中的相对覆盖率,我们提出了一种新的多应用核心词汇集的函数定义和构造方法。我们新开发的核心概念词汇表源自这些词典共识方法,与针对第一语言和第二语言学习或领域语言学等应用的现有广泛使用的核心词汇表高度重叠。我们的深入分析说明了我们新提出的核心词汇集的多种理想属性,包括它们的非组合性。我们使用同源预测方法来恢复大规模多语言词典构建中该核心词汇的缺失覆盖率,我们认为,在为包括机器翻译和语言学习在内的多个下游任务创建低资源语言的新词典时,应该优先考虑这一核心词汇的启发。%U型https://aclantology.org/2020.lrec-1.519%电话:4211-4217
降价(非正式)
【基于多语言词典的核心词汇构建】(https://aclantology.org/2020.lrec-1.519)(Wu等人,LREC 2020)
国际计算语言学协会
- Winston Wu、Garrett Nicolai和David Yarowsky。2020基于多语言词典的核心词汇构建.英寸第十二届语言资源与评价会议记录,第4211-4217页,法国马赛。欧洲语言资源协会。