拉雷卡

LAReQA:从多语种库中检索语言无关的答案。我们提出了LAReQA,一个具有挑战性的新基准,用于从多语言候选库中检索不可知语言的答案。与以前的跨语言任务不同,LAReQA测试的是“强”跨语言对齐,要求语义相关的跨语言对比不相关的同语言对在表示空间上更接近。在多语言BERT(mBERT)的基础上,我们研究了实现强对齐的不同策略。我们发现通过机器翻译来增加训练数据是有效的,并且比使用开箱即用的mBERT有显著的改善。有趣的是,在LAReQA上表现最好的嵌入基线在我们的任务的零触发变体上没有达到竞争基线的水平,而我们的任务只针对“弱”对齐。这一发现强调了我们的观点,即语言无关的检索是一种实质上新的跨语言评估。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换


zbMATH中的参考文献(参考文献1条,第1条标准)

显示结果1/1。
按年份排序(引用)

  1. Uma Roy,Noah Constant,Rami Al-Rfou,Aditya Barua,Aaron Phillips,Yinfei Yang:LAReQA:从多语言池中检索语言无关答案(2020)阿尔十四