@正在进行{botev-etal-2022解码,title=“为形态丰富的语言破译和表征外来词”,author=“Botev、Georgie和Arya D.McCarthy和吴、温斯顿和David Yarowsky“,editor=“Calzolari、Nicoletta和黄、楚仁和Kim、Hansaem和Pustejovsky、James和Wanner、Leo和Choi、Key-Sun和Ryu、Pum-Mo和陈新喜多纳泰利、露西娅和纪、恒和Kurohashi、Sadao和帕吉奥、帕特里齐亚和薛、念文和Kim、Seokhwan和哈哈,英云和何、钟和Lee、Tony Kyungil和桑特斯、恩里科和邦德、弗朗西斯和Na,Seung-Hoon“,booktitle=“第29届国际计算语言学会议论文集”,月=10月,年=“2022”,address=“大韩民国庆州”,publisher=“国际计算语言学委员会”,url=“https://aclantology.org/2022.coling-1.472”,pages=“5309--5326”,抽象=“本文提出了一个详细的基础实证案例研究,研究现代文本中温和资源语言(如保加利亚语)中外来词的性质,并对潜在的构词过程进行了多方面的分布分析,这有助于它们的合成翻译、标记、句法分析、语言迁移建模和其他NLP任务。鉴于外来词(OOV)通常是NLP和机器翻译系统面临的一个关键挑战,尤其是在资源可用性下限方面,通过对这些类型进行详细的手动和自动分类分析,可以获得有用的实用见解以及语体学见解,多维属性,以及多个代表性OOV数据样本的处理潜力。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“botev-etal-2022-decodering”><标题信息>词法丰富语言中外来词的破译和表征</titleInfo><name type=“personal”>乔治博采夫<角色>作者</角色></name><name type=“personal”>雅利娅<namePart type=“given”>D</namePart>麦卡锡<角色>作者</角色></name><name type=“personal”><namePart type=“given”>Winston</namePart>温斯顿</namePart吴<角色>作者</角色></name><name type=“personal”>大卫雅罗斯基<角色>作者</角色></name><originInfo>2022-10年发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第29届国际计算语言学会议论文集</titleInfo><name type=“personal”>尼科莱塔卡尔佐拉里<角色>编辑器</角色></name><name type=“personal”>楚伦<namePart type=“given”>黄<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>汉萨姆Kim(金)<角色>编辑器</角色></name><name type=“personal”>詹姆斯普斯特约夫斯基<角色>编辑器</角色></name><name type=“personal”>利奥瓦纳<角色>编辑器</角色></name><name type=“personal”>Key-Sun键Choi<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>彪马钼</namePart><namePart type=“family”>Ryu<角色>编辑器</角色></name><name type=“personal”>新新<namePart type=“given”><namePart type=“family”>陈</namePart><角色>编辑器</角色></name><name type=“personal”>露西娅多纳泰利<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>恒</namePart>吉(Ji)<角色>编辑器</角色></name><name type=“personal”>萨多<namePart type=“given”>Kurohashi<角色>编辑器</角色></name><name type=“personal”>帕特里齐亚帕吉奥<角色>编辑器</角色></name><name type=“personal”>年文薛(音译)<角色>编辑器</角色></name><name type=“personal”>SeokhwanKim(金)<角色>编辑器</角色></name><name type=“personal”>Younggyun哈姆<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>钟他<角色>编辑器</角色></name><name type=“personal”>托尼京吉岛李<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>恩里科桑特斯<角色>编辑器</角色></name><name type=“personal”>弗朗西斯债券<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>承勋</namePart><namePart type=“family”>Na</namePart><角色>编辑器</角色></name><originInfo>国际计算语言学委员会<位置>韩国庆州</place></originInfo><type-authority=“marcgt”>会议出版物</type></relatedItem>本文提出了一个详细的基础性实证案例研究,研究了保加利亚语等温和资源语言中现代文本中外来词的性质,并对潜在的构词过程进行了多方面的分布分析,这有助于它们的合成翻译、标记、句法分析、,语言建模和其他NLP任务。鉴于外来词(OOV)通常是NLP和机器翻译系统面临的一个关键挑战,尤其是在资源可用性下限方面,通过对这些类型进行详细的手动和自动分类分析,可以获得有用的实用见解以及语体学见解,多维属性,以及多个代表性OOV数据样本的处理潜力</摘要>botev-etal-2022解码<位置><网址>https://aclantology.org/2022.coling-1.472</url></位置><部分>2022-10年<扩展单元=“page”><开始>5309</开始><end>5326</范围></部分></mods></modsCollection>
%0会议记录%形态丰富语言中外来词的破译与表征%乔治·博特夫%A McCarthy,Arya D。%阿武,温斯顿%A Yarowsky,大卫%尼科莱塔·Y·卡尔佐拉里%黄,楚仁%Y Kim、Hansaem%Y Pustejovsky,詹姆斯%Y Wanner,利奥%Y Choi、Key-Sun%Y Ryu,Pum-Mo公司%Y Chen,辛熙%露西娅·多纳泰利%Y Ji、Heng%Y Kurohashi,佐藤%帕特里齐亚·帕吉奥%Y Xue,念文%Y Kim,Seokhwan先生%Y哈姆,Younggyun%Y He、Zhong%Y Lee、Tony Kyungil%恩里科·桑特斯%弗朗西斯·邦德%Y Na、Seung-Hoon%第29届国际计算语言学会议论文集%D 2022年%10月8日%国际计算语言学委员会%C韩国庆州%F botev-etal-2022解码%本文对现代文本中使用温和资源语言(如保加利亚语)所遇到的外来词的性质进行了详细的基础实证案例研究,并对潜在的构词过程进行了多方面的分布分析,这些过程有助于它们的合成翻译、标记、解析、,语言建模和其他NLP任务。鉴于外来词(OOV)通常是NLP和机器翻译系统面临的一个关键挑战,尤其是在资源可用性下限方面,通过对这些类型进行详细的手动和自动分类分析,可以获得有用的实用见解以及语体学见解,多维属性,以及多个代表性OOV数据样本的处理潜力。%U型https://aclantology.org/2022.coling-1.472%电话:5309-5326
降价(非正式)
【词法丰富语言中外来词的破译和特征描述】(https://aclantology.org/2022.coling-1.472)(Botev等人,COLING 2022)
国际计算语言学协会
- 乔治·博特夫(Georgie Botev)、艾丽亚·麦卡锡(Arya D.McCarthy)、温斯顿·吴(Winston Wu)和大卫·亚罗斯基(David Yarowsky)。2022形态丰富语言的词汇外单词的解码和表征.英寸第29届国际计算语言学会议论文集,第5309–5326页,韩国庆州。国际计算语言学委员会。