博客

阅读3分钟。

2024年公共数据文件现已可用,具有新的实验格式

今年的公共数据文件现已可用,其中包括截至2024年4月底存放在Crossref的超过1.9亿成员的1.56亿元数据记录。提供了Crossref元数据统计的完整细分在这里.

与去年一样,您可以通过学术激流一次性下载所有这些记录,也可以通过“请求者付费”方法直接从Amazon S3下载。

下载文件:可以启动torrent下载在这里。有关通过“请求者付费”方法下载的说明以及使用这些文件的其他提示,请参见“使用Crossref公共数据文件和Plus快照的提示”第页。

一月,马丁·伊芙宣布我们一直在试验替代文件格式,以使我们的公共数据文件更容易被更广泛的受众使用。今年的文件将与可用于公共数据文件的工具一起发布,以生成两种实验格式:JSON行数据库(和奖金生锈版本). 你可以在中阅读更多关于我们在这项工作背后的想法马丁的博客帖子,我们很想听听您对这些替代方案的看法。

我们的年度公共数据文件旨在帮助有兴趣使用整个元数据语料库的个人和组织。从一个文件中的大多数元数据记录开始应该比用我们的API从头开始容易得多,但因为Crossref元数据总是公开可用的,所以您可以使用美国石油学会用新的和更新的记录更新您的本地副本。

如果你想知道公共数据文件会得到什么,我们还发布了一个示例版本,这样你就可以在下载~212gb的文件之前先看一眼。此文件包含JSON文件的随机样本,只能通过torrent获得在这里.

我们希望您觉得这个公共数据文件很有用。如果您对如何访问或使用该文件有任何疑问,请参阅下面的提示,或在下面分享您的问题(您将被重定向到我们的社区论坛)。

使用torrent和检索增量更新的提示

  • 如果需要所有Crossref元数据记录,请使用公共数据文件。每个人都欢迎使用元数据,但对您来说,在一个文件中获取这么多记录会更快,在我们的API上也更容易。这里有一些如何使用文件的提示.

  • 拥有初始文件后,使用REST API以增量方式添加新的和更新的记录。这里是如何开始(并且避免受阻于您使用所有这些优秀元数据的热情!)。

  • 虽然书目元数据通常是必需的,因为许多元数据是可选的,但记录的质量和完整性会有所不同。

欢迎在support@crossref.org.

进一步阅读

页面所有者:Patrick Polischuk |上次更新时间:2024-2014年5月