×

使用数据融合的信息检索系统的自动排序。 (英语) Zbl 1195.68038号

摘要:衡量信息检索(IR)系统的有效性对于研究和开发以及监控动态环境中的搜索质量至关重要。在本研究中,我们采用了新的方法对检索系统进行自动排序。在这些方法中,我们使用各种数据融合算法合并多个系统的检索结果,使用合并结果中排名靠前的文档作为“(伪)相关文档”,并使用这些文档对系统进行评估和排序。使用文本检索会议(TREC)数据的实验与相同系统的人性化评估具有统计显著的强相关性。我们假设,选择返回不同于大多数系统的文档的系统可以将普通系统从数据融合中消除,并在文档和系统之间提供更好的区分。这可以提高自动排名的效率。基于这种直觉,我们介绍了一种选择用于数据融合的系统的新方法。为此,我们使用偏差概念来测量系统与范数或多数的偏差,并在数据融合过程中使用具有较高偏差的系统。这种方法与基于人的结果之间的相关性更高。我们证明了我们的方法优于先前提出的自动排序方法。

MSC公司:

第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接