×

LAReQA公司

swMATH ID: 32538
软件作者: 乌玛·罗伊、诺亚·康斯坦特、拉米·阿尔罗福、阿迪蒂亚·巴鲁阿、亚伦·菲利普斯、杨银飞
描述: LAReQA:从多语言池中检索语言认知答案。我们提出了LAReQA,这是一个具有挑战性的新基准,用于从多语言候选库中检索与语言无关的答案。与之前的跨语言任务不同,LAReQA测试了“强”跨语言对齐,要求语义相关的跨语言对在表示空间上比不相关的相同语言对更接近。基于多语言BERT(mBERT),我们研究了实现强对齐的不同策略。我们发现,通过机器翻译来增加训练数据是有效的,并且比使用开箱即用的mBERT显著提高。有趣的是,在LAReQA上表现最好的嵌入基线没有达到我们任务中只针对“弱”对齐的零快照变体的竞争基线。这一发现强调了我们的主张,即语言认知检索是一种全新的跨语言评估。
主页: https://arxiv.org/abs/2004.05484
关键词: arXiv_cs。;机器学习;arXiv_cs。LG公司;多语言BERT;答案检索;多语言池;基准
相关软件: BERT(误码率);小队
引用于: 0个文档

标准条款

1出版物描述软件 年份
LAReQA:从多语言池中检索语言认知答案arXiv公司
乌玛·罗伊、诺亚·康斯坦特、拉米·阿尔罗福、阿迪蒂亚·巴鲁阿、亚伦·菲利普斯、杨银飞
2020