12多年来Microsoft学术搜索,后来重命名为Microsoft学术版最终Microsoft学术图表(MAG)一直是软件巨头的学术书目信息服务。尽管它是所有科学领域中最全面的收藏之一,但微软显然从未想过MAG是社区的持久基础设施,而是某些内部研究和技术项目的游乐场。因此当微软决定在2021年停止MAG时,许多依赖MAG作为数据源的研究人员感到沮丧。

在这一点上我们的研究,他们已经提供了非常有用的Unpaywall服务,介入并致力于创建一个开放的继任者,以继承专有且注定失败的MAG数据股票:OpenAlex公司创建为一个完全开放的数据集,描述学术出版物、作者、场所、机构、概念及其复杂的联系。在MAG团队早期工作的基础上,它提供了广泛的公共API,其所有数据都可以在CC0 1.0公共领域专用许可证。该服务于2022年1月开始提供网站的其他部分计划于2022年9月推出。

OpenAlex的名字来源于亚历山大大图书馆可能是古代世界最重要的图书馆。这个名字确实很合适,因为它已经处于当前状态,它列出了超过所有学科的2.4亿份出版物和2.5亿多作者,以及120k+出版场所、100k+机构和65k+主题概念。随着OurResearch团队致力于不断改进和扩展其语料库中的数据,OpenAlex很有可能成为开放数据资产科学界,并将在未来几年变得更有价值。

首次集成

今年早些时候,我们已经在dblp中创建了OpenAlex数据的第一个实时集成,在出版物的详细信息页面上提供了更多信息。此集成查询公共OpenAlex API,以便检索dblp数据集中没有的文章信息,如文章所包含的概念或其引用统计信息。

与dblp中的所有external-data-API集成一样,OpenAlex集成在默认情况下被禁用,以保护您的隐私。为了使用集成时,您需要通过选中出版物详细信息页面右栏中的“loadmoredatafromopenalex.org”选项进行一次opt-in。

或者,您可以使用dblp网站右上角的设置菜单来启用OpenAlex API。查找项目“OpenAlex data”并选中相应的框“load data from OpenAlex.org”。

启用后,无论何时访问dblp中的发布详细信息页面,浏览器都会自动从OpenAlex API加载更多可用信息。目前,将加载两条信息。第一个是包含概念的标记云一篇论文。OpenAlex使用了6500多个不同的概念,这些概念是从维基数据并安排按等级划分在树上。此概念树是一个修改后的版本,它基于早期为原始MAG所做的分类工作,其概念由根据MAG数据训练的自动分类器.

第二条信息是这个(公开)已知引用次数近年来收到的一篇论文。由于OpenAlex API的技术限制,超过十年的引文不可用。

请注意,由于所有集成信息都是直接从OpenAlex的实时API获取的,所以所有信息都显示为-is,数据不是由dblp团队管理的,dblp小组也没有任何方法编辑或扩展数据。有关它提供的数据的更多信息,请咨询OpenAlex文档.

我们感谢OpenAlex团队的开放和提供了如此宝贵的资源,我们祝愿他们在OpenAlex的全面发布及以后一切顺利。