D-Lib杂志
垫片
数字图书馆研究杂志
垫片
透明图像

D-Lib杂志

2012年1月/2月
第18卷,编号1/2
目录

 

网络期刊文章的五星——文章评价框架

大卫·肖顿
牛津大学动物学系
david.shotton@zoo.ox.ac.uk网站

doi:10.1045/2012年1月10日-肖顿

 

打印机友好版

 

摘要

我提出了五个因素——同行评议、开放存取、丰富的内容、可用的数据集和机器可读的元数据——作为在线期刊文章的五星,这是一个多维出版领域中的五个独立标准的集合,在线期刊文章可以根据这五个标准进行评估,看看它们与增强研究交流的当前愿景的匹配程度。每个出版轴上的成就都可能不同,类似于星座中不同的恒星以不同的亮度发光。我建议对每一篇文章使用五点量表进行评估,并为此类评估提供图表表示。虽然这些量表采用的标准有点武断,而且每个轴上特定文章的评级可能涉及主观判断因素,但这些五星在线期刊文章提供了一个概念框架,用于判断任何文章达到或低于理想的程度,这应该对作者、编辑和出版商有用。我用自己最近发表的与语义发布相关的出版物举例说明了这种评估。

 

1.简介

许多人都会熟悉Tim Berners-Lee的“链接开放数据五星”(文本框1),这是一个渐进的步骤,它将公开数据在Web上的发布分类为越来越有用的级别,将语义Web当前的共同愿景封装为链接的开放数据网站,并且个人可以使用它来对自己的数据发布进行评级。

Tim Berners-Lee的关联开放数据五星(来自伯纳斯李, 2009)
星星 使您的数据在网络上可用(无论格式如何),但有一个开放的许可证,成为开放数据.
星星星星 将它们作为机器可读的结构化数据提供(例如,excel而不是表的图像扫描)。
星星星星星星 如(2)所示,但使用非专有格式(如CSV而非excel)。
星星星星星星星星 以上所有内容,以及:使用W3C的开放标准(RDF和SPARQL)来识别事物,以便人们可以指向您的东西。
星星星星星星星星星星 所有这些,加上:将您的数据链接到其他人的数据以提供上下文。

为了补充这些,我建议网络期刊文章五星特别是描述通过网络技术改进主要学术传播媒介的潜力。这些五星在线期刊文章的背景涉及语义出版、研究传播未来的考虑以及语义网本身。

语义Web

虽然支持语义Web有时看起来像《旧约》中的先知,他们的真理信息被大众所忽视,被一些有影响力的政党所接受,例如英国广播公司以及在“链接的数据最近,语义网技术得到了更广泛的接受。原则很简单。如果实体及其关系可以通过使用引用公共可用和普遍接受的结构化定义词汇(本体)的唯一URI以机器可读的形式识别和定义,并且如果这些关系中的每一个都表示为简单的主语-谓语-宾语语句(“三元组”),遵循的语法资源描述框架(RDF),然后可以将这些语句组合成相互连接的信息网络(RDF图),在该网络中维护每个原始语句的真实内容,从而创建一个知识网,即语义网。

实体及其关系的本体论描述使来自独立来源的数据能够在不模糊或不损失精确含义的情况下进行整合,如果实体以其他方式(如XML、,标记术语缺乏普遍认可的含义经常导致同义词(例如,一个模式中的“creator”是否等同于另一个模式的“composer”或“choreographer”)或同音词(例如标记术语“gift”的潜在不同含义,即“present”在英语数据库中,但在德语数据库中是“毒药”)。

现在有许多强有力的例子表明,语义网技术的“幕后”使用如何允许将数据集成到统一一致的服务中,这些服务最初是使用不兼容的元数据模型编码的,并存储在异构数据库中。我个人参与的最好的例子是克拉罗斯“语义网络上的艺术世界”,其中描述世界博物馆中收藏的古代艺术品的信息来自许多学术来源(库尔茨等。, 2009). 语义网技术对图书馆的好处最近在2011年的年度报告中进行了讨论图书馆中的语义网会议名称数据网络中的学术交流年在德国汉堡举行2011年11月.

语义发布

期刊出版作为新研究成果的主要传播渠道和公共记录,是学术工作流程的重要组成部分,其关键商品原始研究文章至关重要,因为它提供了作者假设的“记录版本”,支持发表时的结果和结论,并经同行评审验证,因此成为科学记录中不变的一部分。自大约350年前发表以来,科学期刊文章的基本格式几乎没有改变。它仍然是一种线性修辞叙事,在这种叙事中,作者试图通过展示从大量数据中选取的实验证据来说服读者具体假设的正确性。

目前,大多数期刊出版商仅将互联网用作以PDF格式分发期刊文章的便利机制,提供打印页面的电子传真。虽然PDF文档便于打印和脱机阅读,但通常缺乏任何形式的语义增强或用户交互性,以及它们给机器解释带来的困难,目前阻碍了自动化服务的发展,这些服务可能会丰富期刊文章的内容或在文章之间链接信息。

然而,最近各种倡议已经开始改变这一现状,探索如何利用网络以各种印刷品无法实现的方式丰富在线学术交流。例如,对期刊文章的HTML版本进行了语义增强的示例(肖顿, 2009;肖顿等。,2009),创建了文本管理Web服务,可以自动向HTML文本中的命名实体添加语义标记(帕菲利斯等。,2009)或从引用的论文中提取上下文信息(等。和“智能”PDF阅读器(如乌托邦文档)已经开发出来,可以提供注释覆盖,以丰富PDF文章的其他静态内容(阿特伍德等。, 2010). 西尔维奥·佩罗尼和我开发了SPAR(语义发布和引用)本体为此类发展提供便利(肖顿, 2010;佩罗尼和肖顿,2011),以及出版商,包括皇家化学学会项目展望爱思唯尔未来的文章、和Pensoft日记账,开始提供语义丰富的期刊文章,作为其日常发布工作流的一部分。

具有此类增强功能的期刊文章的发布被称为“语义发布”,我将其定义为简单Web和语义Web技术的使用:

  • 丰富在线研究文章的内容,例如通过交互式图形、可重新排序的参考列表、语义镜头(例如,在数字数据表上移动鼠标时显示图形,或在图表上移动鼠标后显示动画),
  • 增强文章内容的含义,例如通过命名实体的语义标记,链接到术语和概念含义的描述性定义,以及有关这些实体的附加信息(例如,链接到特定蛋白质名称的蛋白质数据库条目),
  • 提供与文章相关的其他信息源的链接,例如作者的主页、试剂供应商的网站和相关的国际组织(例如流行病学论文中的世界卫生组织),
  • 提供直接的链接到文章引用的所有参考文献,
  • 以可操作的形式提供对已发布文章中数据的访问,例如作为可下载的电子表格或CSV文件,
  • 将文章链接到支撑它们的完整研究数据集,
  • 促进文章数据与文献或网络上其他地方语义相关的科学信息的集成,以及
  • 通过公开发布机器可读的描述性元数据来帮助发现,例如详细描述文章的书目记录,总结其内容,提供其引用参考文献的书目细节。

这种语义发布的目的是使在线文章中描述的数据、信息和知识更容易被发现、提取、组合和重用。

研究传播的未来

2011年举行了四次重要会议,将学者、计算机科学家和学术出版商聚集在一起,讨论学术传播的未来。第一个是一个研讨会,题为超越PDF2011年1月,由加州大学圣地亚哥分校的菲利普·伯恩(Philip Bourne)组织和主办,其本身是在2010年5月爱思唯尔实验室的安妮塔·德瓦尔德(Anita de Waard)在阿姆斯特丹举办的早期HyPER研讨会的基础上建造的(德瓦德等。, 2009). 随后举行了一次题为超越影响由STFC的Cameron Neylon于2011年5月在伦敦Wellcome Trust总部组织,该会议考虑了期刊影响因子的替代指标,以评估研究——尤其是研究人员——的价值。2011年8月,关于研究传播的未来由UCSD的Phil Bourne、哈佛大学的Tim Clark、麦格理大学的Robert Dale、爱思唯尔实验室的Anita de Waard、W3C的Ivan Herman、南加州大学的Eduard Hovy和我本人组织,作为达格斯图尔宫视角研讨会这导致了Force11社区致力于改善研究交流和电子奖学金,并于2011年10月出版了Force11白皮书(伯恩等。作为证据提交给皇家学会科学作为公共事业项目和英国内阁办公室的公众咨询使开放数据成为现实最近,2011年10月,微软研究院(Microsoft Research)和哈佛大学(Harvard University)在马萨诸塞州剑桥市联合举办了一次会议,题为转变学术交流这推动了这些想法的发展。在这些会议上所进行的思考对在线期刊文章五星的制定做出了重大贡献。

 

2.网络期刊文章五星

我建议五个因素——同行评审、开放存取、丰富内容、可用数据集和机器可读元数据——作为网络期刊文章五星这是一个多维出版领域中的五个独立标准的集合,可以根据这些标准评估在线期刊文章,旨在描述Web技术对期刊文章的改进潜力。

 
五星图 空间
同行评审
确保你的文章经过同行评审,以保证其学术价值、质量和完整性。
开放式访问
确保其他人可以免费开放阅读和重用您发布的文章,以确保其最大的读者群和有用性。
丰富的内容
充分利用Web技术和Web标准的潜力,为在线文章的内容提供交互性和语义丰富性。
可用数据集
确保支持您报告结果的所有数据都是在开放许可证下发布的,并且有足够的元数据来重新解释和重用这些数据。
机器可读元数据
发布描述文章和引用引用的参考的机器可读元数据,以便可以自动发现和重用这些描述。
 
 

Tim Berners-Lee的链接开放数据五星模型是一个接一个地构建的,代表了在线数据发布单轴的成就或完整程度,而拟议的在线期刊文章五星模型则是互补的,在多维出版领域中,形成沿五个独立轴排列的星座,每个星座都可以根据自身的优点进行评估。当然,每个出版轴上的成就程度都可能不同,相当于星座中不同的恒星以不同的亮度发光。

因此,五星在线期刊文章包含了更丰富的愿景。每一颗星本身都是非常令人向往的,但只有将它们结合起来,我们才能真正促进学术交流。现在让我们考虑如何对每个明星的个人文章表现进行评分。我的评论主要针对作者,但每个人都应该清楚,实现这些出版目标需要期刊出版商和编辑的积极和热情合作。

2.1同行评审

确保你的文章经过同行评审,以保证其学术价值、质量和完整性。

期刊文章的质量保证传统上是通过匿名出版前同行评审提供的。根据我自己的经验,同行评议一直是一种积极的经历,评议是公平的,根据评议者的评论所做的修改总是会提高文章的整体可读性和质量。然而,由于几个原因,这种做法目前正受到严重挑战。首先,进行出版前同行审查的制度效率低下,而且拖延时间,在提交供出版的论文数量不断增加的压力下,这一制度十分吃力。第二,那些被期望为其学术同行的利益而开展这项活动的学者,如果没有学术出版商的付款,则越来越不愿意这样做,因为好的评论需要付出努力,而评论家在学术认可方面获得的报酬很少,当他们受到来自其他方面的压力时。第三,该服务因未能实现其目标而受到批评,即确保被接受发表的论文始终具有高质量。最后,它有时还为极端学术不端行为提供了机会,让审稿人有机会推迟竞争对手作品的出版,同时进行基于被盗思想的研究,从而为审稿人提供了属于被审稿人的学术信誉。

已经提出了三种方法来改进同行审查程序并防止此类不当行为。首先,应该取消评审员的匿名性,这不仅是为了减少不当行为,而且也是为了让大多数愿意花时间参与这一过程的优秀评审员能够更透明地获得学术学分。第二,评论应该与被评论的文章一起发布,以便读者能够看到评论人对最终文本的贡献。第三,最具争议的是,质量保证过程应该与出版行为脱钩。

现在,少数期刊对其所有论文都采用了完全开放式审查,结果明显令人满意。然而,这项政策的批评者指出,至少在人文学科等一些批评文化不那么公开的学科中,缺乏匿名性可能会阻碍评审员发表更直率的评论,从而削弱评审过程。

由于现在出版可以完全在线进行,与印刷纸质期刊相比,成本大大降低,因此不要求文章在出版前以最终形式准备。出版后同行评审使评审责任从期刊编辑人员选定的两三个人扩大到更广泛的学术界,然后将其反馈纳入论文的修订版,然后再重新发布。

这种发表后同行评审被许多科学家认为是“轻量级”的,并被批评为对有争议或高兴趣的论文有效,但对兴趣更有限的健全论文无效,尤其是因为读者自身面临时间压力,不愿意从事没有既定学术奖励机制的活动。然而,对于发布互联网规范和Web标准文档的人来说,发布后同行评审是严格的规范互联网工程特别工作组(IETF)和由万维网联盟(W3C)-初始发布的全部目的是在新标准正式达成一致并发布之前,在指定的一段时间内,让这些文件可供发布后同行评审,在此期间,任何相关方的意见和批评都会得到接收并采取行动。

在线发表的论文还可以获得评论,并受到读者的认可度,论文的质量至少部分取决于其感知的有用性,尽管在实践中,对已发表文章发表此类评论的机会有限。

这些替代可能性使我们能够使用以下简单的五点量表(从0到4),从有效性和开放性的角度评估同行评审过程,这是在线期刊文章五星中的第一篇:

0 无同行评审
文章发表时未经出版前同行评审,例如自然预喂食或在预打印服务器上,如arXiv公司.
1 出版前同行评审
应期刊编辑的邀请,这篇文章已经由两位或两位以上合适的专家进行了评论和审查,并根据审稿人的评论和建议被接受发表。评论员保持匿名,他们的评论不会发表。这是许多期刊文章的情况。例如,一些期刊公共科学图书馆,不要求评论员评估文章的潜在重要性、影响或吸引力的广度,只要求评估文章的科学合理性。
2 响应式同行评审
这篇文章已经由两位或两位以上合适的专家(无论是在首次出版之前还是之后)进行了评论和审查,作者通过反驳评论员发给期刊编辑的批评意见,对这些评论做出了实质性回应,或者根据审稿人的意见和建议对论文的最终出版版本进行修改。评论员保持匿名,他们的评论不会发表。大多数期刊的文章都采用这一政策。
出版后同行评审
除了对期刊文章进行回应性的同行评审外,读者还可以在文章发表后发表评论。这些可能会扩大文章中的讨论范围,引起对其他相关发现的关注,或对作者的结论提出质疑。这些评论也可供文章的其他读者阅读,作者被提醒并能够对其作出回应,因此构成了出版后同行评审。公共科学图书馆(公共科学图书馆)期刊,以及其他期刊,都为他们的文章启用了这一功能。还可以进行其他形式的出版后同行审查,例如区域合作框架和候选人建议。
4 开放式同行评审
整个审查过程完全透明。每一份提交的手稿都会立即在该杂志的网站上公布。欢迎读者的评论和评论,并与该杂志征求专家的正式同行评论一起考虑。所有评论、作者的回复以及文章的原始和最终版本都已发布,指定的审稿人和编辑在最终版本中得到了姓名确认。英国医学杂志实行这种公开的同行评审语义Web期刊强烈鼓励这样做,同时允许评论员保持匿名。

2.2开放存取

确保其他人可以免费开放阅读和重用您发布的文章,以确保其最大的读者群和有用性。

近年来,互联网给学术出版带来了最根本的变化,除了期刊文章从印刷到在线提供的转变,以及对订阅访问出版商传统商业模式的最大挑战,就是开放访问(OA)提供的增长,在这种情况下,读者可以免费阅读文章,而无需付费。如果没有使用互联网以低廉的价格提供内容的技术可能性,开放存取运动就会死灰复燃。

与同行评审一样,不同程度的访问开放是可能的,必须谨慎区分。特别是,开放存取文章可以用于阅读但此类文章可能仍受版权和许可证限制。这些措施阻止了所有形式的传播、复制和重新使用超出版权法“合理使用”或“公平处理”原则允许的范围,从而防止未经版权所有者书面许可,将内容重新用于文本挖掘、衍生作品的制作或商业目的。

用于描述不同类型开放存取的术语令人困惑,而且使用的方式也各不相同。我在这方面的理解是由以下两篇关于这个主题的特别有用的博客文章指导的:萨伯(2008)和彼得·默里-鲁斯特(2011),明确区分两个正交分类轴:

  • 这个位置文章的开放存取副本,特征为绿色:绿色开放通道表示OA文章可从网站免费获得期刊网站,例如来自机构存储库;虽然黄金开放通道意味着文章可以从期刊自己的网站免费获得。
  • 这个类型开放存取,特征为免费的利比亚:免费开放存取意味着消除价格壁垒查看权文章;虽然libre开放访问这意味着消除了价格障碍和至少一些限制重用的许可障碍使用权文章。

虽然这两个词都意味着“自由”(一个可能模棱两可的词),但免费开放访问等同于“啤酒中的自由”,而libre开放访问则等同于“言论中的免费”。因此,免费开放是自由开放的必要条件,但不是充分条件。

与学术出版相关的基本开放存取宣言——2002年布达佩斯开放存取计划,2003年关于开放获取科学和人文知识的柏林宣言和2003年贝塞斯达关于开放存取出版的声明-所有定义的OA都是以“libre”为导向的散文,但许多出版商对开放存取的定义仅等同于免费开放存取。完全开放意味着什么开放式定义开放式知识基金会:

“如果有人可以自由使用、重复使用和重新分发一段内容或数据,那么它就是开放的——最多只受属性和共享要求的约束。”

绿色开放存取和金色开放存取物品都可以是免费开放存取或自由开放存取。Libre开放访问最明确地指定为使用显式许可证,例如知识共享署名许可协议明确规定了授予文章读者/用户的权利,或通过使用将文章置于公共领域的权利放弃。没有这样一个明确的规范,明智的做法是假设任何OA文章都只是“免费开放访问”。

显然,很难将这两个正交分类合并到五星之二所需的单一评估量表中,因此我采取了保守的方法,假设OA文章仅为免费开放访问,除非另有说明:

0 无开放访问
这篇文章发表在订阅访问期刊上,没有个人或机构订阅的人无法阅读。作者通常需要将版权转让给出版商,并且不允许在机构存储库或其他地方自行存档已发表的文章。
1 自我存档绿色/免费开放存取
订阅访问期刊允许作者在机构存储库或其他地方免费自行发布文章的预印本、同行评议后的“后印本”或出版商PDF副本,允许第三方免费阅读文本,但不得自由重复使用。期刊网站上的文章副本只对订阅者开放。
2 资金强制绿色/免费开放访问
为了响应文章中所述研究项目资助者的委托,在资助机构向出版商支付费用后,出版商允许将文章的副本存放在公共医学中心允许第三方免费阅读文本,尽管不能自由重复使用。期刊网站上的文章副本只对订阅者开放。
Author-pays黄金/免费开放访问
作为作者(或作者所在机构)向出版商支付费用的交换,该杂志将在杂志网站上发布文章,以便第三方可以免费阅读文章,尽管他们不能自由重复使用内容。允许作者黄金/免费开放访问的期刊还可以允许在机构存储库或其他地方以绿色/免费开放的方式自行存档已发表的文章。
4 Author-pays gold/libre开放访问
作为作者(或作者所在机构)向出版商支付费用的交换,该杂志将根据知识共享或类似的归属许可证在杂志网站上发布文章,使文章可以免费阅读,至少可以进行一些形式的重用,包括自存档,前提是要为出版商的“记录版本”提供归属。

这些分类需要进一步解释:

无开放访问

一些订阅访问期刊,主要是生物医学期刊,允许作者在封锁期通常为六到十二个月后,将文章的出版版本上传到机构存储库或个人网站(即自我存档的绿色/免费开放访问)。有关这方面的信息由提供SHERPA/RoMEO公司然而,及时获取最新发布的研究信息仍然严格限于期刊订阅者。

自我存档绿色/免费开放存取

在物理、数学和计算机科学中,使用康奈尔大学的ArXiv预打印存储库是常态。ArXiv是一个示例性存储库,因为它的所有内容都可以在Creative Commons署名许可证Creative Commons Attribution-Noncommercial-ShareAlike许可证,或通过与知识共享公共领域声明因此,ArXiv含量明显为绿色/利比亚开放存取。

然而,对于大多数研究学科来说,在提交期刊出版之前,没有将预印本存放在一个特定主题的开放档案中的文化,绿色开放存取在开放存取选择中排名第四。这既是因为潜在读者很难找到分散在机构存储库中的文章的开放访问版本(尽管新的跨存储库搜索服务,如核心正在改善这种情况),并且因为此类内容重用的许可协议通常不明确。

例如,考虑牛津研究档案牛津大学的机构知识库。ORA提供了一个有用的版权指南为了作者在ORA中存放作品的利益,讨论了出版商对已发表作品的版权限制,以及可能性提到了使用Creative Commons许可证的问题。然而,它对读者关于ORA内容的指导如下:

“其中许多项目的全文免费提供根据版权和最终用户许可使用." (我的重点)

Eprints Soton公司南安普顿大学机构研究库发表了相同的声明,而剑桥Dspace剑桥大学(University of Cambridge)的机构知识库有一个更严格的总括声明:

“版权和其他知识产权存在于本网站、保存的作品以及任何随附的文档和元数据中。除非另有说明,保存的作品剑桥DSpace仅供非商业研究或私人学习使用,可免费访问、打印和下载。你可能不会进一步复制、复制、出版。。。或其他使用已存作品全部或部分或以任何方式或在任何媒体上,未经已存作品相应权利所有人的明确书面许可。" (我的重点)

最近存放的ORA研究文章的元数据,Knight的PDF副本. (2011),中国农民工短缺与农村剩余劳动力的困惑,不包含有关本文的开放访问状态的信息,因此必须假定这是唯一的免费开放访问。这一点可以通过访问爱思唯尔杂志网站上的原始文章得到证实,中国经济评论 22(4) :585-600(2011年12月)doi:10.1016/j.chieco.2011.01.006,其中有一个链接“权限和重印”,可将您带到一个名为“RightsLink版权清除中心”的页面。在那里,人们可以计算将文章重复用于研究或私人学习以外的目的的成本。在牛津大学内使用该文章的15份印刷本作为教学材料将花费26.74英镑,而在商业组织内使用该论文的15份打印本进行培训将花费384.34英镑。

我们必须假设其他机构存储库的情况与此类似,除非有明确的libre开放访问许可证,否则项目只能作为绿色/免费开放访问。因此,正如彼得·穆雷·鲁斯特(Peter Murray-Rust)得出的结论:“默认情况下,除非作者/自我档案主义者做出特殊努力,否则读者(机构存储库中的项目)无权使用存放的项目。”(穆雷-鲁斯特, 2011).

资金强制绿色/免费开放访问

尽管资助机构向出版商支付的费用是为了存放一份文章公共医学中心数量可观(通常每篇文章3000至5000美元),重要的是要意识到这将获得读者免费的开放访问权限。特别是,内容不可用于文本挖掘。在PubMed Central的全部内容中,约有230万篇文章,只有约10%在PubMed Central所称的范围内开放存取子集拥有某种形式的libre开放访问许可证,这些许可证主要来自出版商,他们自己也有gold/libre开放访问政策。正是从这些文章的参考列表中,而不是完整的PubMed Central语料库中,我们创建了打开引文语料库在大约630万份参考书目中,引用了1950年至2010年间发表的所有生物医学论文的约20%,包括每个学科中最重要的论文。根据libre Creative Commons归属许可证发布,并以RDF表示,这些引用可用于人类监督以及通过SPARQL端点,整个语料库也可以已下载以便重新使用。

作者支付黄金/免费开放访问

authorpays gold/fredis open access的费用通常很高,每篇文章500美元到3250美元不等。SHERPA/RoMEO网站提供细节。由于我的五星计划是在文章级别而非期刊级别运行,因此我在这里不区分在订阅访问期刊(有时称为“混合”开放访问期刊)中单独开放访问的文章,以及“真正的”开放存取期刊中的文章,其中所有文章都是开放存取的。Elsevier将前一种安排称为“赞助访问”,将所有文章都开放访问的期刊称为“作者付费期刊”。然而,在个人文章层面上,没有区别:作者支付费用,每个人都可以在出版商的网站上自由阅读文章。

相反,问题是读者是否对文章拥有重用权,或者是否只授予黄金/免费的开放访问权限。例如,爱思唯尔关于作者开放存取文章的政策在其条款和条件页面,点击唯一开放存取期刊主页上的条款和条件脚注即可访问,国际外科杂志病例报道。除其他限制外,该条款规定:

“本网站上包含或访问的所有内容……均归爱思唯尔或其许可方所有,并受版权、商标和其他知识产权以及不正当竞争法的保护。您不得复制、展示、分发……或从……全部或部分内容……创建其他衍生作品,除非另有明确规定根据本条款和条件、相关许可或认购协议或我们的授权,您不得。。。自动搜索、删除、提取、深层链接或索引任何内容。"

显然,为了换取约3000美元的爱思唯尔文章赞助费或作者支付期刊文章费,读者只能获得黄金/免费的开放访问。这种低性价比可能反映在这样一个事实上:2009年,在450种提供“赞助商访问”的Elsevier期刊中,只有515篇“赞助商获取”文章被发表。

Author-pays gold/libre开放访问

author-pays gold/libre开放访问的费用通常也很高,每篇文章的费用也在500美元至3250美元之间,但在这种情况下,出版商允许第三方免费阅读期刊网站上的所有文章,并重新使用内容。作为萨伯(2008)指出,libre开放访问包含了一系列可能性,与之相对应的是,已经授予了重用权限。例如,可以使用文章的内容来创建衍生作品,但如果要将其用于商业目的,则无法使用。重用的范围取决于发布文章所依据的许可证的性质。因此,将libre开放存取称为“完全开放存取”过于简单。

生物医学中心公共科学图书馆生物医学科学OA期刊的两大出版商(PLoS)都对其出版的所有作品使用最为宽松的开放存取归属许可证。(BioMed Central Open Access许可协议具有不同的名称,但在其他方面与公共科学图书馆使用的知识共享署名许可相同。)根据该许可,作者保留其内容的版权所有权,但允许第三方下载、重新使用、重印、修改、分发、,和/或出于任何目的(包括商业目的)复制内容,只要引用了原始作者和来源。不需要作者或出版商的许可。这显然是对已发布文章的潜在重用者最有帮助的情况。这个语义增强我们能够申请里斯等。(2008)中的文章被忽视的热带病(肖顿等。(2009年)之所以成为可能,是因为该文章是在这种许可下发布的。

2.3丰富内容

充分利用Web技术和Web标准的潜力,为在线文章的内容提供交互性和语义丰富性。

Web技术可用于提供学术期刊文章的各种语义增强、与文本上下文相关的外部信息源的链接以及不同类型的用户交互,如语义发布导言部分。

0 没有增强功能
这篇文章以HTML或PDF文档的形式在线发布,除了在同一篇文章的印刷版中可以找到的功能外,没有其他功能。
1 活动Web链接
在线文章包含与文章直接相关的信息和网站的功能性网络链接,例如作者主页、供应商目录、数据库和引用文章。
2 文本的语义丰富
识别并区分文本中的关键术语和概念,例如,使用鼠标悬停弹出窗口提供语义定义、公式、数据库条目链接等,这些都是由实时Web服务驱动的。参考列表有引用类型。
“生动”内容
文章包含交互式图形、显示图形下数字数据的语义透镜、提供与文本引用上下文相关的被引用论文摘录的弹出窗口、可重新排序的参考列表以及其他形式的交互式内容。
4 数据融合(“mash-ups”)
文章中的数据与预先存在的信息集成(例如,与其他文章或数据库中的类似数据集成),文章中的地理位置数据可以作为KML文件在Google Maps中可视化,等等。

由于可能的各种类型的语义丰富以及实现它们的一些方法已经在其他地方详细介绍过了(肖顿等。, 2009;肖顿和波特温,2009年),在此不再进一步讨论。如上所述,一些出版商和期刊编辑正在进行这种丰富。然而,这些最好是在创作过程中实现的。在撰写文章时,作者可以通过确保提供大量指向外部Web资源的链接(例如,指向他们自己的主页、试剂供应商的目录和引用的文章),轻松在功能方面取得快速胜利。Word 2007的一个开源插件已经发布,它允许根据所选本体对命名实体进行语义标记(芬克等。,2010年),希望其他此类语义创作工具也能很快问世。

2.4可用数据集

确保支持您报告的结果的所有数据都是在开放许可证下完全发布的,并且有足够的元数据来重新解释和重用这些数据。

通过STM出版布鲁塞尔宣言学术出版商强烈支持这一原则,即与期刊文章相关的研究数据应免费提供,以便能够检查数据并验证文章中的主张,并允许在其他情况下重复使用数据。特别是如果研究是在公共资金的支持下进行的,现在越来越多的人认为研究数据应该被视为一种公共利益(博尔顿等。, 2011;木材等。,2010年),并正在提议促进其出版的机制(格林伯格等。, 2009;范德格拉夫和瓦伊杰斯, 2011;伯恩等。, 2011). 然而,在这种值得称赞的开放热情中,重要的是要承认发现或创建数据的研究人员投入的个人时间和精力,以及他们的道德权利,即在为他人利益发布数据之前,有第一次机会探索、发布数据并从中获得学术利益。

同样重要的是要强调,“数据”一词应该在这里用非常笼统的术语来解释,以涵盖期刊文章文本之外的任何研究调查结果。因此,“数据”可以包括图像、录音和视频、图形和图表、动画和模拟、数学模型、协议和工作流、软件以及数字数据集。

蒂姆·伯纳斯-李(Tim Berners-Lee)在他的《链接开放数据五星》(Five Stars of Linked Open data)中已经描述了如何最好地在网络上提供数据的原则。一些重叠是不可避免的,但以下评级旨在反映自然提供的数据,以及在何处、何时和向谁授予该可用性。

0 没有发布数据
唯一可用的数据是读者可以从文章本身中获得的数据。图和表不能单独下载,也没有任何支持数据集。
1 可用的补充信息文件
补充信息文件可从期刊网站获得,和/或文章中包含研究数据的图表可供下载。然而,这些实体的格式并未针对重用进行优化,例如,公共科学图书馆期刊文章中的图表仅以TIFF或PNG图像格式提供。
2 可以可操作的形式下载文章数据
文章的图表和补充信息文件中包含的数据以适当的可操作格式提供,例如可下载的数字电子表格或CSV文件中的数字数据。
已发布的基础数据集
在研究项目期间创建的完整研究数据集(从中选择了已发表文章中包含的数据子集)发布在永久性档案或存储库中,具有唯一的可解析标识符(例如URI(URI)或aDataCite内政部),带有开放存取数据许可证或aCC零豁免和公共领域专用性,并具有足够的描述性元数据,以实现其重新解释和重用。
4 同行评审可用的数据
与该杂志合作,支持期刊文章的数据集可供同行评审员使用,以帮助对文章进行评估。这通常是在与文章同时发布这些数据集之前私下实现的。

在哪里?数据的发布非常重要。作者应该记住,期刊补充信息文件作为有价值研究数据的存储库,在开放性、可发现性、管理性和可靠的持久性方面,其性质非常令人不满(埃万耶卢等。, 2005;安德森等。, 2006;史密特, 2011). 作为公开数据的安全避风港,它们应该转而关注机构存储库,或者更好地,关注特定主题的数据库和存储库。例如Dryad数据存储库管理与同行评议期刊文章链接的生物数据集,使其在出版前可供同行评议者使用,然后在与文章同时或在可选的禁运期后,在知识共享下出版CC零公开数据豁免数据引用DOI允许适当引用和授予学术学分。

2.5机器可读元数据

发布机器可读的元数据,描述您的文章和引用的引用,以便能够自动发现它们。

迄今为止,出版商已经使用了各种基于XML的专有信息模型和文档类型定义(DTD)来标记电子文档的组成部分(标题、作者列表、摘要等),以帮助发布过程,但通常甚至这些基本元数据也无法供读者使用,他们只得到了文章的PDF版本。

采用W3C标准(如RDF和OWL2(OWL2)允许使用标准词汇表对此类信息进行编码,使计算机能够自动查询元数据并集成来自多个资源的基于Web的信息。这个语义发布和引用本体论只是一些用于描述学术出版物的词汇吗(佩罗尼和肖顿, 2011).

使用这些Web标准和词汇表,可以使用DoCO公司文档组件本体,并创建和发布描述期刊文章本身的机器可读RDF元数据,即对定义文章的标准书目信息(作者、出版年份、标题、期刊名称、卷号、页码、DOI等)进行编码,使用FaBiO公司,与FRBR一致的书目本体论和BiRO公司书目参考本体。同样,也可以对文章参考列表中所有参考文献的书目信息进行编码,并使用CiTO公司,引用类型本体,两者都断言存在引用和被引用论文之间的引文(即<论文a>引文:引文<论文B>),并从事实和修辞两方面描述该引文的类型或性质(肖顿, 2010;佩罗尼和肖顿, 2011).

当然,机器可读元数据不必仅此而已。越来越多的清单和最低信息标准规定了研究出版物中应包含的信息,或定义了元数据来描述特定领域内的文章或数据集。其中一个例子是MIIDI公司,报告传染病调查的最低信息标准。使用MIIDI编辑器,可以根据MIIDI构建元数据,以描述传染病调查及其研究成果,包括期刊文章和研究数据集。对于前者,元数据可以包括关于研究调查的主要假设和文章中描述的主要结论的陈述,还可以提供关于疾病性质、患者人数等的事实陈述。

文章元数据的可用性可以按以下等级进行评级:

0 没有可用的元数据
本文仅以PDF文档形式发布。发布者在文章制作、编辑和发布工作流期间使用的XML标记未发布。
1 可用的结构标记
在线文章的XHTML版本中包含了使用出版商DTD的文档结构的XML标记,表示标题、作者列表、摘要等。
2 书目和引文元数据可用
文章的完整书目元数据参考列表的完整引文元数据以可下载的机器可读文件或三重存储中的链接开放数据的形式发布。
丰富的嵌入式标记
附加的结构、修辞和语义标记嵌入在线文章中,编码为资源描述框架或者以类似的机器可读格式。
4 结构化文章摘要
本文关键事实、假设、数据和结论的机器可读摘要以人类和机器可读的形式免费提供,基于适用于该领域的最低信息标准。

有几种方法可以提供这种元数据。如上所述,结构标记可能包含在XHTML文档本身中。通过使用RDFa,还可以在Web文档中嵌入语义标记,从而使这些机器可读的元数据成为链接开放数据Web的一部分。使用微观数据在内部HTML5文件。或者,书目和引文元数据可以作为补充的在线RDF文件随附在相关期刊文章中:此类文件随附肖顿(2010)和我们的增强版里斯等。(2008). 然而,对于与文章相关的研究数据集,如果相关元数据文件也被提交到适当的链接开放数据存储库(例如开放书目项目打开引文语料库.

描述论文内容的详细元数据可以构成结构化数字摘要的基础,以人类和机器可读的形式描述文章的本质,该摘要可以作为打开研究报告在开放存取数据期刊中(更严格地说,在本例中是“元数据期刊”),而论文中的个别事实陈述可以发布为纳米出版物(格罗斯等。, 2010).

 

3.对照五星评价已发表的文章

虽然第2节中给出的评估量表所采用的标准有些武断,而且每个轴上特定物品的评级可能涉及主观判断因素,这五颗星的在线期刊文章提供了一个概念框架,用来判断任何文章达到或达不到理想的程度,这应该对作者、编辑和出版商有用,他们现在应该问问自己:

“我的在线期刊文章与这些五星杂志相比怎么样?”

作为“喝我自己的香槟”的练习,我评估了里斯等。(2008)我们的语义增强前后的文章,以及我自己最近的出版物,包括本文,提供了示例。根据第2节给出的五分制评分标准,对每一篇在线期刊文章的五星进行评分。我通过星座图(其中恒星具有不同的星等)和表格形式展示了结果,并对每篇论文进行了总体数字评级。(以下论文的完整书目详细信息见工具书类第节)

 

里斯等。(2008).

日志:被忽视的热带病出版单位:公共科学图书馆。

本研究报告包含巴西萨尔瓦多城市贫民窟居民感染钩端螺旋体病风险因素的不同类型分析数据。潜在的未公开原始数据集包含有关个人健康、财务、家庭和就业状况的机密信息。

评级:原始版本: http://dx.doi.org/10.1371/journal.pntd.0000228.

图示5颗星 同行评审(P)回应性同行评审,为读者提供发表后评论的机会。
开放存取(O)4黄金/自由。在开放存取期刊上发布,并获得Creative Commons归属许可证,从而使对原文的语义增强成为可能肖顿.(2009).
丰富内容(E)0文章在文本中缺少有用的网络链接,并且缺少到大多数参考论文的直接链接。
可用数据集(A)1文章中的图形和表格有自己的DOI,但只能作为图像下载,因此图形和表格中的数据无法以可操作的形式提供。摘要的葡萄牙语翻译可作为单独的可下载Word文档提供。
机器可读元数据(M)1 本文的XHTML版本中提供了结构标记。
整体评级:9  
 

出版一周后,我选择了Reis等。(2008)关于语义增强的论文,该论文在作者和公共科学图书馆的支持下进行,在肖顿等。(2009)和肖顿和波特温(2009). 然后,我用这些增强功能重新发布了这篇论文,作为一个范例。

评级:语义增强版本: http://dx.doi.org/10.1371/journal.pntd.0000228.x001.

图示5颗星 同行评审(P)对原创文章进行回应性同行评审,为读者提供发表后评论的机会。
开放存取(O)4黄金/自由。使用Creative Commons属性许可证重新发布的语义增强版本。
浓缩含量(E)4有多种类型,如中所述肖顿等。(2009).
可用数据集(A)2该表的数据和两个数字由作者善意提供,并以可操作的形式作为Excel电子表格和他们自己的DOI下载。各种补充信息文件可用,包括涉及谷歌地图的数据融合补充和其他论文的相关数据。摘要的葡萄牙语翻译可用作带有语义标记的单独XHTML文档。文章摘要也可作为单独的文件提供。但是,摘要中包含的语句不是机器可读的格式,并且没有底层元数据标准。
机器可读元数据(M)XHTML文本中的结构和语义标记;嵌入式RDFa提供基本书目信息;增强的文章附带了两个可下载的RDF文件及其DOI,一个文件提供了关于文章的完整书目元数据,另一个文件为所有引用的参考文献提供了书目详细信息、引用类型信息和引用频率。
整体评级:16  
 

Shotton(2009)。

日志:学术出版。出版商:学术与专业协会出版商协会。

本文描述并回顾了语义发布的现状。本文中没有数值数据。

评级:

图示5颗星 同行评审(P)2响应性同行评审。
开放存取(O)1自我存档绿色/免费。在订阅访问期刊上发布,允许作者在其他地方发布文章。
丰富内容(E)1文本中有丰富的网络链接,以及指向所有参考文章的直接链接。没有其他形式的语义丰富。
可用数据集(A)0不适用于本条。
机器可读元数据(M)0没有。文章仅提供PDF格式。
整体评级:4  
 

肖顿等。(2009).

日志:计算生物学出版单位:公共科学图书馆。

本文描述了应用于Reis公司等。(2009). 因此,它没有自己的主要研究数据。

评级:

图示5颗星 同行评审(P)回应性同行评审,为读者提供发表后评论的机会。(注意:编辑和其中一位审稿人向作者透露了她的身份,他们不遗余力地帮助作者改进论文,包括反复审阅。)
开放访问(O)4黄金/自由。在开放存取期刊上发布,并具有Creative Commons归属许可证。
丰富内容(E)1文本中有大量的网络链接,指向所有参考文章的直接链接,带有自己DOI的图形,以及指向我们增强版本的语义增强示例的链接里斯等。(2008). 没有对论文本身进行语义增强。
可用数据集(A)1本文中发布了两个具有自己DOI的补充信息文件,提供了对Reis进行语义增强的技术细节等。(2008).
机器可读元数据(M)1本文XHTML版本中提供的结构标记。
整体评级:10  
 

Shotton(2010)。

日志:J.生物医学语义学出版商:BioMed Central。

评级:

图示5颗星 同行评审(P)回应性同行评审,为读者提供发表后评论的机会。
开放存取(O)4黄金/自由。在开放存取期刊上发布,并具有许可的归属许可证。
丰富内容(E)1文本中有大量的网络链接,直接链接到所有引用的文章,以及带有自己DOI的图表,但缺乏文本的语义标记,缺乏任何交互性。
可用数据集(A)4CiTO本体在线可用,具有可下载的人类可读补充信息文件,其自身的DOI提供进一步解释,所有这些都可供同行评审员使用。
机器可读元数据(M)2文本中的结构标记可用作XML。可下载的RDF文件及其自己的DOI,其中一个提供关于文章的完整书目元数据,另一个提供所引用参考文献的书目详细信息、引用类型信息和引用频率。没有语义标记,没有嵌入式RDFa,也没有文章摘要。
整体评级:14  
 

Shotton(2012)(本文)

日志:D-Lib杂志出版商:国家研究计划公司(CNRI)。

本文是一份立场文件,提出了一些想法(就FaBiO本体,一个法比奥:主张),不包含研究数据。

同时D-Lib杂志没有对其文章进行正式的同行评审,并且有不发表以前在其他地方发表过的文章的政策,这篇文章得益于同事们的大量评论(参见致谢更多详细信息)这篇论文的预印本发表于自然预喂食为2010年10月微软研究院/哈佛大学会议做准备转变学术交流。我很感谢《》的编辑团队D-Lib杂志尽管预印本已经出版,但他们在接受这篇文章时表现出了灵活性,因为收到的评论构成了对预印本的有效的出版后回应同行评审,并刺激了文本的重大修订和扩展,显著增强了结果的内容和质量数字图书馆文章。由于这些改进,部分五星评价量表已被修订,导致上述评级肖顿(2009年)和肖顿等。(2009),相对于预印本中这些论文的分数降低。

评级:

图示5颗星
同行评审(P)


预印本的出版后响应性同行评审-见以上评论。
开放存取(O)4黄金/libre开放存取无需支付作者费用!
丰富内容(E)1文本和所有参考文献中有丰富的Web链接。没有额外的文本语义增强。
可用数据集(A)0不适用。
机器可读元数据(M)1仅HTML中的结构标记。
总体评级:9  
 

上述评级表明,文章的性质将影响获得的总体评级。例如,没有主要研究数据的评论和立场文件在可用数据集方面总是得分较低。

在线期刊文章本体的五星,可从http://purl.org/spar/fivestars/是一个用OWL 2 DL编写的简单本体,它是SPAR的一部分,SPAR是一套语义发布和引用本体(http://purl.org/spar/). 它旨在供出版商和其他希望以机器可读的形式对五星评级(如上文所示)进行编码的人使用,以便它们可以与文章的其他机器可读元数据一起使用。以下RDF图以乌龟符号表示,给出了本文的五星评级:

@前缀fivestars:<http://purl.org/spar/fivestars/> .
@前缀xsd:<http://www.w3.org/2001/XMLSchema#> .

<http://dx.doi.org/10.1045/january2012-shotton(2012年1月)>
五颗星:hasPeerReviewRating“3”^^xsd:nonNegativeInteger;
五颗星:peerReviewRatingComment“发布后响应性同行评审预印本的。”;
fivestars:hasOpenAccessRating“4”^^xsd:nonNegativeInteger;
fivestars:openAccessRatingComment“Gold/libre无作者开放访问费用!" ;
五颗星:hasEnhancedContentRating“1”^^xsd:nonNegativeInteger;
fivestars:enhancedContentRatingComment“文本和所有引用中有丰富的Web链接。没有额外的文本语义增强。”;
fivestars:hasAvailableDatasetsRating“0”^^xsd:nonNegativeInteger;
fivestars:hasMachine-readableMetadataRating“1”^^xsd:nonNegativeInteger;
fivestars:machine-readableMetadataRatingComment“HTML中的结构标记只有。" ;
五颗星:hasOverallFiveStarsRating“9”^^xsd:nonNegativeInteger;
五颗星:总体五颗星评级评论“本文的性质是一篇立场论文,而不是一篇包含主要研究数据的研究论文,影响了获得的总体评级。”。
 

Ubiquity出版社已表示希望采用此类评估,并对其发表的每一篇文章进行五星评级。我鼓励其他出版商也这样做。

致谢

我非常感谢鲍勃·杜查尔姆在伯纳斯-李的《链接开放数据五星》的启发下,他在一次题为应用XML和语义技术解放传染病数据这是我在最近的牛津XML暑期学校所做的。我感谢Tanya Gray和Katherine Fletcher在阅读本文初稿后提供的反馈。我想特别感谢西尔维奥·佩罗尼他坚持要求我为所有五颗星制定评估标准,并将其关于同行评审和开放获取的建议纳入其中;由那些参加了关于五星预印本的简短但生动的讨论的人超越PDF邮件列表,尤其是卡梅隆·尼伦菲利普·洛德建议彻底修订我最初的同行评议评估量表,对出版后同行评议和RFC做出明智的评论,以及彼得·默里-鲁斯特他坚持认为出版开放存取出版物所依据的许可证类型至关重要;布莱恩·霍尔属于Ubiquity出版社感谢他的评论以及他对五星概念车的普遍热情。他们的建议构成了对预印本如前所述,我衷心感谢他们花时间和精力提供这些宝贵的评论。

工具书类

[1]Anderson NR、Tarczy-Hornoch P和Bumgarner RE(2006年)。关于生物医学出版物中补充资源的持久性。BMC生物信息学 7: 260.http://dx.doi.org/10.1186/1471-2105-7-260.

[2]Attwood TK、Kell DB、McDermott P、Marsh J、Pettifer SR和Thorne D(2010年)。乌托邦文献:将学术文献与研究数据联系起来。生物信息学 26:i568-i574。http://dx.doi.org/10.1093/bioinformatics/btq383.

[3]Berners-Lee T(2009)。链接的数据。可在http://www.w3.org/DesignIssues/LinkedData.html.

[4]Boulton G、Rawlins M、Vallance P和Walport M(2011年)。科学作为公共企业:开放数据案例。刺胳针,377: 1633-1635.http://dx.doi.org/10.1016/S0140-6736(11)60647-8.

[5]Bourne P、Clark T、Dale R、de Waard A、Herman I、Hovy E和Shotton D,代表Force11社区(2011年)。Force11白皮书:改善研究交流和电子奖学金的未来(2011年10月28日出版)。http://force11.org/white_paper.

[6]德瓦尔德(de Waard)A、白金汉姆(Buckingham Shum S)S、卡鲁西(Carusi)A、帕克(Park J)、萨姆瓦尔德(Samwald M)和桑德拉(Sándorá)(2009)。假设、证据和关系:代表科学知识主张的HypER方法。在:第八届国际语义网络会议论文集,科学语篇中语义网络应用研讨会(2009年10月26日,华盛顿特区)。计算机科学课堂讲稿斯普林格·弗拉格:柏林。http://oro.open.ac.uk/18563/.

[7]Evangelou E、Trikalinos TA和Ioannidis JP(2005)。无法从主要期刊上发表的文章中获得在线补充科学信息。美国财务会计准则委员会J.19: 1943-1944.http://dx.doi.org/10.1096/fj.05-4784lsf.

[8]Fink JL、Fernicola P、Chandran R、Parastatidis S、Wade A、Naim O、Quinn GB和Bourne PE(2010年)。本体识别的附加词:科学文献的语义丰富。BMC生物信息学 11: 103.http://dx.doi.org/10.1186/1471-2105-11-103.

[9]Greenberg J、White HC、Carrier S和Scherle R(2009年)。科学数据存储库的元数据最佳实践。图书馆元数据杂志 9(3-4): 194-212.http://dx.doi.org/10.1080/19386380903405090.

[10]Groth P、Gibson A和Velterop J(2010年)。纳米出版物的剖析。信息服务与使用杂志 30: 51-56.http://dx.doi.org/10.3233/ISU-2010-0613.

[11]Kurtz D、Parker G、Shotton D、Klyne G、Schroff F、Zisserman A和Wilks Y(2009年)。CLAROS——将古典艺术带给全球公众。程序。IEEE电子科学会议牛津,2009年12月9日至11日,第20-27页。http://doi.ieecomputersociety.org/10.109/e-Science.2009.11.

[12]Murray-Rust P(2011)。绿色和金色开放存取?自由与无偿。读者和回头客重要的原因。博客帖子.

[13]Pafilis E、O'Donoghue SI、Jensen LJ、Horn H、Kuhn M、Brown NP和Schneider R(2009)。生命科学家的反射增强浏览。自然生物技术 27: 508-510.http://dx.doi.org/10.1038/nbt0609-508.

[14]Peroni S和Shotton D(2011年)。FaBiO和CiTO:描述书目资源和引文的本体。(提交出版)。预打印.

[15]Reis RB、Ribeiro GS、Felzemburgh RDM、Santana FS、Mohr S、Melendez AXTO、Queiroz A、Santos AC、Ravines RR、Tassinari WS、Carvalho MS、Reis MG和Ko AI(2008)。环境和社会梯度对钩端螺旋体城市贫民窟的感染。被忽视的热带病 2:e228。http://dx.doi.org/10.1371/journal.pntd.0000228.

[16]Shotton D(2009)。语义出版:即将到来的科学期刊出版革命。学术出版 22: 85-94.http://dx.doi.org/10.1087/2009202.A型印后可用。

[17]Shotton D和Portwin K(2009年)。应用于Reis的语义增强的技术实现等。(2008)环境和社会梯度对城市贫民窟钩端螺旋体感染的影响。被忽视的热带病 2(4) :e228。支持信息文件S1至Shotton等。(2009).http://dx.doi.org/10.1371/journal.pntd.000228.x009.

[18]Shotton D、Portwin K、Klyne G和Miles A(2009年)。语义发布冒险:研究文章的示例语义增强。计算生物学 5:e1000361。http://dx.doi.org/10.1371/journal.pcbi.1000361.

[19]Shotton D(2010)。CiTO,引文类型本体。J.生物医学语义学 1(补充1):S6。http://dx.doi.org/10.1186/2041-1480-1-S1-S6.

[20]史密特E(2011)。阿伯拉德和赫洛伊斯:为什么数据和出版物属于同一类。D-Lib杂志体积17,编号1/2。http://dx.doi.org/10.1045/january2011-smit(具体见图12)。

[21]Suber P(2008)。免费和自由开放存取。SPARC开放获取新闻稿(2008年8月版)。网址:http://www.arl.org/sparc/publications/articles/gratisandlibre.shtml.

[22]Van der Graaf M和Waaijers L(2011年)。冲浪板。制定关于研究数据的四国行动方案。知识交流报告。http://www.knowledge-exchange.info/Default.aspx?ID=469.

[23]Wan S、Paris C和Dale R(2010年)。支持浏览特定的信息需求:介绍引文敏感的浏览器摘要。Web语义:万维网上的科学、服务和代理 8: 196-202.http://dx.doi.org/10.1016/j.websem.2010.03.002.

[24]Wood J、Andersson T、Bachem A、Best C、Genova F、Lopez DR、Los W、Marinucci M、Romary L、Van de Sompel H、Vigen J、Wittenburg P、Giaretta D和Hudson RL(2010)。乘风破浪:欧洲如何从不断上升的科学数据浪潮中获益。科学数据问题高级别专家组的最后报告;提交给欧洲委员会的文件,2010年10月。可从以下位置获得http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdf.

 

关于作者

David Shotton的照片

大卫·肖顿是一名细胞生物学家背景,目前积极开发管理研究数据的服务,例如DataFlow项目。他还从事语义发布,开发范例文章SPAR本体用于描述出版、书目实体和引文的各个方面。最近的发展包括创建打开引文语料库,包含PubMed Central内所有开放存取文章参考列表中的书目引用,以及MIIDI公司,报告传染病调查的最低信息标准。其目的是将MIIDI与MIIDI编辑器有助于输入符合MIIDI的丰富元数据,以创建打开研究报告,可在开放存取数据期刊上发布的传染病数据集或研究文章的结构化数字摘要。他的其他兴趣包括使用语义技术来帮助人文学科中的数据集成,例如CLAROS,“语义网络上的艺术世界”。最近给出了更多细节会议演示文稿,在他的博客帖子中开放引文和语义发布博客.

 
透明图像