神经信息检索


卡普里奥卢斯

Capreolus公司是一个用于促进端到端神经自组织检索实验的工具包。Capreolus通过使用可互换和可配置的模块对整个实验管道进行精细控制,使研究人员能够轻松地使用现有方法进行实验(例如,重排名、第一阶段排名、索引等),并在可配置的管道中实现自己的方法。

要了解更多信息阅读Capreolus的文档了解详细概述在GitHub上查看代码。


经济增加值

BERT等预先训练的语言模型与近似最近邻搜索相结合,可以快速匹配查询和文档的密集表示,证明了这种排序方法既有效又高效。然而,仅预训练语言模型并不能完全捕获有关不常见实体的信息。EVA克服了这一限制,用来自外部源的实体信息来丰富现有的密集查询和文档表示。为了处理包含许多松散相关实体的文档,EVA采用了一种策略来创建反映文档不同视图的多个实体表示。例如,一份关于科学家的文件可能涵盖了她个人生活和最近工作的各个方面,这些方面与对该实体的不同看法相对应。

要了解更多信息,请阅读EVA论文或查看上的代码github.