dblp有多完整?

简短回答:dblp仍然相当不完整,并且可能会一直如此。

详细答案:

dblp团队努力提供尽可能全面的计算机科学参考书目,但(当然)永远无法达到真正的完整性。我们有

一个相当小的编辑团队

对所有新增产品进行严格的质量检查每天都有大量新的学术著作向公众发布。因此,我们的资源是有限的,因此我们必须不可避免地选择一些可能的新增项目,并优先考虑其他项目。

通常有三个主要因素限制了dblp的全面性:

  1. dblp是一个重点关注的书目计算机科学主题然而,一个研究领域从哪里开始或从哪里结束还有待讨论,许多学术研究都是在跨学科或混合领域进行的。因此,由于我们必须在某个地方划一条界线,跨学科领域可能永远不会像我们在核心计算机科学领域所做的那样被全面涵盖。
  2. 但即使是在核心计算机科学领域,大量的学术著作对于一个小型团队和像我们这样注重质量的工作流来说也太多了。因此,我们旨在通过评估一般国际计算机科学界最感兴趣的卷和问题,以自上而下的方式处理我们的任务。这些决策由咨询委员会确定的标准和原则。但它们往往是艰难的决定,而且是根据具体情况做出的。
  3. 最后,但可能是最重要的一点,开放书目元数据的可用性(或者,更确切地说,缺乏)始终是我们索引决策的限制因素。我们无法索引我们无法从可靠、开放的资源中找到和复制的内容。尽管近年来情况有所改善,但这仍然是我们收到的所有索引请求中很大一部分的限制。

虽然我们自己没有任何度量标准或研究来科学严谨地回答这个问题,但有许多学术文章讨论了dblp的完整性问题。然而,这些研究已有几年的历史,近年来我们的覆盖面有了很大提高。(如果您知道最近的研究,我们将不胜感激给我们发封电子邮件.)但如果您正在寻找有关此主题的研究,您可能想从这里开始:


本文研究了两个联机计算机科学引文数据库DBLP和CiteSeer之间的异同。[……]该模型允许我们预测DBLP数据库大约涵盖计算机科学全部文献的24%。


我们的结果显示,截至2005年底,Laender等人和Martins等人列出的会议的总覆盖率为65%,这只是所有计算机科学会议的一小部分。然而,通过创建此列表的方式,我们可以假设它包含最相关的列表。


服务莱布尼茨信息中心(Schloss Dagstuhl)