@正在进行{nag-etal-2021数据,title=“低资源多语言关系分类的数据引导方法”,author=“Nag、Arijit和Samanta、Bidisha和Mukherjee、Animesh和Ganguly、Niloy和查克拉巴蒂,苏丹”,editor=“比萨扎、阿里安娜和阿本德,奥姆里“,booktitle=“第25届计算自然语言学习会议记录”,月=11月,年=“2021”,address=“在线”,publisher=“计算语言学协会”,url=“https://aclantology.org/2021.coll-1.45",doi=“10.18653/v1/2021.conll-1.45”,pages=“575--587”,abstract=“关系分类(有时称为{`}提取{'})需要可靠的数据集来微调大型语言模型以及进行评估。数据收集对印度语言来说是一项挑战,因为它们在句法和形态上都是多样的,并且不同于英语等资源丰富的语言。尽管最近人们对印度语言的深层生成模型感兴趣,但公共数据集仍然不能很好地支持关系分类。作为回应,我们展示了IndoRE,这是一个包含39K个实体和关系标记的黄金句子的数据集,使用三种印度语言和英语。我们从一个基于多语言BERT(mBERT)的系统开始,该系统捕获实体跨度位置和类型信息,并提供有竞争力的单语关系分类。使用该系统,我们探索并比较了语言之间的传输机制。特别是,我们研究了昂贵的黄金实例与翻译和对齐的银{`}实例之间的准确性和效率权衡。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“nag-etal-2021-data”><标题信息>低资源多语言关系分类的数据引导方法</titleInfo><name type=“personal”>ArijitNag<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>比迪沙Samanta(萨曼塔)<角色>作者</角色></name><name type=“personal”>Animesh动画穆克吉<角色>作者</角色></name><name type=“personal”>尼洛伊甘古里(Ganguly)<角色>作者</角色></name><name type=“personal”>灵魂查克拉巴蒂<角色>作者</角色></name><originInfo>发布日期:2021-11发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第25届计算自然语言学习会议记录</titleInfo><name type=“personal”>阿里安娜<namePart type=“family”>Bisazza</namePart><角色>编辑器</角色></name><name type=“personal”>欧姆里Abend(阿本德)<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>在线</place></originInfo><type-authority=“marcgt”>会议出版物</type></relatedItem>关系分类(有时称为“提取”)需要可靠的数据集来微调大型语言模型以及进行评估。数据收集对印度语言来说是一项挑战,因为它们在句法和形态上都是多样的,并且不同于英语等资源丰富的语言。尽管最近人们对印度语言的深层生成模型感兴趣,但公共数据集仍然不能很好地支持关系分类。作为回应,我们展示了IndoRE,这是一个包含39K个实体和关系标记的黄金句子的数据集,使用三种印度语言和英语。我们从基于多语言BERT(mBERT)的系统开始,该系统捕获实体跨度位置和类型信息,并提供竞争性单语关系分类。使用该系统,我们探索并比较了语言之间的传输机制。特别是,我们研究了昂贵的黄金实例与翻译和对齐的“白银”实例之间的准确性效率权衡</摘要><identifier type=“citekey”>nag-etal-2021-data</identifier><identifier type=“doi”>10.18653/v1/2021。conll-1.45</identifier><位置><网址>https://aclantology.org/2021.coll-1.45</url></位置><部分>2021-11年<扩展单元=“page”><开始>575</开始><end>587</范围></部分></mods></modsCollection>
%0会议记录%低资源多语言关系分类的数据引导方法%阿里吉特·纳格%碧迪莎·萨曼塔%阿尼梅斯·穆克吉%尼洛伊·甘古利%查克拉巴蒂,苏丹%阿里安娜·比萨扎%奥姆里·阿本德%第25届计算自然语言学习会议论文集%D 2021年%11月8日%计算语言学协会%C在线%F nag-etal-2021数据%X关系分类(有时称为“提取”)需要可靠的数据集来微调大型语言模型以及进行评估。数据收集对印度语言来说是一项挑战,因为它们在句法和形态上都是多样的,并且不同于英语等资源丰富的语言。尽管最近人们对印度语言的深层生成模型感兴趣,但公共数据集仍然不能很好地支持关系分类。作为回应,我们展示了IndoRE,这是一个包含39K个实体和关系标记的黄金句子的数据集,使用三种印度语言和英语。我们从基于多语言BERT(mBERT)的系统开始,该系统捕获实体跨度位置和类型信息,并提供竞争性单语关系分类。使用该系统,我们探索并比较了语言之间的传输机制。特别是,我们研究了昂贵的黄金实例与翻译和对齐的“白银”实例之间的准确性效率权衡。%R 10.18653/v1/2021-coll-1.45%U型https://aclantology.org/2021.coll-1.45%U型https://doi.org/10.18653/v1/2021.coll-1.45%电话575-587
降价(非正式)
[低资源多语言关系分类的数据引导方法](https://aclantology.org/2021.coll-1.45)(Nag等人,CoNLL 2021)
国际计算语言学协会
- Arijit Nag、Bidisha Samanta、Animesh Mukherjee、Niloy Ganguly和Soumen Chakrabarti。2021一种低资源多语言关系分类的数据引导方法.英寸第25届计算自然语言学习会议记录,第575-587页,在线。计算语言学协会。