dblp.xml(请参见在这里详细信息)只包含dblp中发布和人员记录的最新版本。它还仅提供了最新的修改日期。为了更好地了解dblp的历史发展,我们提供了一个历史数据集hdblp.xml它包含dblp中所有记录的所有历史修订(有一些限制)。hdblp可用于研究以下问题:
- 特定年份中索引的记录类型是什么?
- 随着时间的推移,记录发生了什么样的修改?
- 过去纠正了哪些缺陷?
hdblp.xml旨在研究dblp的开发。如果您对dblp的当前状态感兴趣,请使用每日和每月发布的dblp.xml(请参阅在这里详细信息)
hdblp.xml具有与dblp.xml相同的结构,并使用相同的dtd。然而,hdblp.xml不是每个出版物或个人记录的单个条目,而是包含每次修改记录(包括创建记录)时记录元数据的完整副本。。下面的示例显示了具有多个修订的发布记录:
<article key=“journals/jsyml/NewmanT42”mdate=“2017-05-28”><作者>M.H.A.NewmanAlan M.Turing<title>Church类型理论中的一个形式定理</标题><pages>28-33</pages>1942年<volume>7</volume><期刊>J.Symb。日志</日志><number>1</number><url>db/journals/jsyml/jsyml7.html#NewmanT42<ee>https://doi.org/10.2307/2267552</ee><ee>https://projecteuclid.org/euclid.jsl/1183389307</ee></文章>...<article key=“journals/jsyml/NewmanT42”mdate=“2003-10-13”><作者>M.H.A.Newman<作者>A.M.Turing<title>丘奇类型理论中的一个形式定理</标题><pages>28-33</pages>1942年<volume>7</volume>符号逻辑杂志<number>1</number><url>db/journals/jsyml/jsyml7.html#NewmanT42</文章>
该出版物于2003年10月13日首次在dblp中编入索引。最近的修订是在2017-05-28。在这种情况下,第二作者的名字被扩展并添加了网络链接。
hdblp.xml具有以下限制。
- 由于数据处理中的错误,无法在1999年6月之前准确跟踪记录元数据。
- 当天发生的记录修改将合并到单个修订中。
- 在dblp的早期,并不是每个作者配置文件都有自己的个人记录。因此,一些作者的个人记录无法追溯到其开始。
可下载的数据文件提供了更详细的描述。
我们在以下位置提供hdblp.xml数据集https://zenodo.org/record/3051910在下面与dblp.xml相同的许可证(CC0 1.0)。我们计划大约每年更新两次文件。
服务