类别
新闻 SWORD第2版

讨论SWORDv2的范围

作为SWORD v2开发的一部分技术咨询小组一直在忙于讨论拟议新版标准的许多方面。这是一个生动有趣的过程。如果你愿意阅读这些讨论贡献任何反馈,都欢迎您!

一条特别有趣的线索来自该项目的技术负责人该消息涉及SWORD v2的范围(它应该对哪些领域做出贡献,不应该对哪些方面做出贡献):

大家好,

在过去的一两周里,这份清单上有很多精彩的讨论,我想现在是时候总结一下我认为关键的症结所在:剑的范围。

这一论点有两个不同的方面,正如本清单所述:

a) 我们应该采用内容管理API的方法,如CMIS或更可能的GData

b) SWORD不应该说明内容发送到服务器后会发生什么。

总的来说,我出于一些原因反对(a)。首先,我担心与GData相关的习惯用法不一定合适。分级文件系统是一种常见的习惯用法,但它却是一种习惯用法,因此它不是SWORD在其之上构建自己的地方。CMIS我很难反驳或接受,所以我愿意接受任何一种方式。其次,我认为没有理由重新创建内容管理标准,因为它们已经存在。相反,SWORD应该为这些标准没有为我们的部门/用例提供的东西提供支持,同时不阻止它们的使用。

从纯粹主义者的角度来看,(b)SWORD提供的主要功能是支持Packaging(大写P)。这对社区来说是一个有价值的补充,因为它在我们的行业中很常见,而且至少GData没有明确涵盖,我认为CMIS也没有涵盖(不过,还是可以纠正的)。不过,对打包的支持需要扩展到AtomPub的完整CRUD实现,这是概要文件试图做的大部分工作。我认为我们已经进行了一些很好的技术讨论,这将使概要文件的下一个草案在这方面做得更好。

同时,配置文件中有一些灰色区域部分,特别是“进行中”和“抑制元数据”,它们的内容管理比存放的内容管理更多。我个人认为这些很重要;它们是轻触式的,配置文件并不强制服务器遵守它们,它们有助于实现已知的用例。同样,该声明也可以被视为更多的内容管理,尽管我们试图将其定位为更多的信息资源,而非操作资源(即读取而非写入)。

我对下一个草案的建议如下:我们将花更多时间分析使用此列表上的反馈更新和覆盖存款包的适当方法。我们将扩展概要文件,以涵盖您将如何在内容管理操作中使用SWORD标头/如果这是您的实现所需的/(例如,您可能如何使用Suppress Metadata或in Progress with GData)。显然,我们有足够的时间发表评论。

总而言之:我们必须限制剑的范围,使之不触及任何人的脚趾,对社区有价值。这样或那样走得太远,我们要么被取代,要么毫无价值。

干杯,

理查德

类别
SWORD第2版

关于SWORDv2挑战的决定

跟随一些最近的重大讨论SWORD技术咨询小组,我们很高兴地宣布已经就SWORD新版本2的一些细节做出的一些决定。宣布这些决定的完整电子邮件如下所示,或者可以在技术咨询小组的列表档案中看到:http://www.mail-archive.com/sword-app-techadvisorypanel@lists.sourceforge.net/msg00105.html

这些决定是在过去几周的小组讨论中做出的。它们涉及以下问题:

  1. 声明是应嵌入存款凭证中,还是应作为atom:link元素中引用的单独文档:为了使SWORD v2从一种火力与目标方法转变为一种SWORD客户端可以通过我们所称的“存款生命周期”与存款进行交互的方法,需要某种形式的反馈,以便客户端可以向服务器询问存款项发生了什么事。该提案旨在通过提供“声明”来支持这一点。把它想象成一张银行账户对账单:你可以看到银行账户中有什么(存款),存款可能发生了什么(例如增加了利息),以及项目的全部细节。这里的问题是,当SWORD客户存款时,是否应向其提供报表副本,或者客户是否应在需要时要求提供报表副本。
  2. 是将OAI-ORE用于Statement格式还是Atom Feed(根据CMIS和GData):关于如何格式化该语句,需要做出决定。它应该格式化为OAI-ORE资源映射,还是使用Atom Feed。每种方法都有利弊。
  3. 客户端和服务器应如何就编辑媒体链接(EM-URI)返回的内容的格式进行协商:如果允许多种格式的语句,客户端和服务器应如何根据服务器功能和客户端首选项的组合,就哪种格式是最好的发送格式达成协议。这个问题被称为内容协商。

下面的完整电子邮件概述了这些问题以及所做的决定。接下来的工作是尝试实施该标准,根据开发人员和初始用户的经验,该标准可能会进一步完善。

尊敬的各位:,

感谢您对我们在本列表中讨论的各种问题的广泛反馈,对于项目团队来说,获得这些意见非常有价值。我们认为,我们已经确定了三个有争议的具体问题:

1/声明是应嵌入存款凭证中,还是应作为atom:link元素中引用的单独文档

2/是将OAI-ORE用于Statement格式还是Atom Feed(根据CMIS和GData)

3/客户端和服务器应如何就edit-media链接(EM-URI)返回的内容格式进行协商

项目团队仔细研究了每一个问题,并试图提取最简单的解决方案,但目的是在此阶段保持SWORD 2.0规范的开放性,以便社区最佳实践能够真正为标准本身提供长期信息。

因此,我们提出以下解决这些问题的方法:

1/声明是应嵌入存款凭证中,还是应作为atom:link元素中引用的单独文档

如果要在存款凭证中嵌入对账单,那么它确实需要采用OAI-ORE形式,以便明确的外部加价。然而,考虑到声明是否应该是Atom Feed还有一个问题,很明显,这个解决方案本身是不够的。因此,我们建议向项目资助开发商提供的用于编码的标准表示,OAI-ORE序列化可以嵌入到存款凭证中(存款凭证本身不需要满足OAI-ORE规范)。

除此之外,存款凭证中可能还有一个或多个原子:链接元素,链接到外部报表。这些atom:link元素可以指定其类型属性,以说明它们是application/rdf+xml还是application/atom+xml;type=进给。规范要求必须有一个嵌入式语句或至少一个单独的语句。

因此,您可能会看到这样的存款凭证:

<atom:entry><atom:link rel=“http://purl.org/net/sword/terms/声明“type=”application/rdf+xml“href=”网址://。。。。。"/><rdf:rdf>    <!-- 此处显示ORE语句--></rdf:rdf></atom:entry>

2/是将OAI-ORE用于语句格式还是Atom提要(根据CMIS和GData)

(1)中方法的另一个很好的理由是,这意味着我们可以提供具有不同类型属性的不同语句URI。我们计划要求开发人员在项目资金下生成ORE和Atom Feed Statement格式。因此,您可能会看到这样的存款收据:

<atom:entry><atom:link rel=“http://purl.org/net/sword/terms/声明“type=”application/rdf+xml“href=”网址://。。。。。"/><atom:link rel=“http://purl.org/net/sword/terms/statement(网址:http://purl.org/net/sword/terms/statement)“type=”application/atom+xml;type=feed“href=”网址://。。。。。"/><rdf:rdf><!-- 此处显示ORE语句--></rdf:rdf></atom:entry>

(1)和(2)中的方法组合可能看起来很模糊或不确定,但我们认为我们无法提前确定这些方法中哪种更好,应该由用户和实现者社区根据开发软件的实际使用情况决定哪种方法最有效。因此,虽然实施的负担由项目的资助部分承担,但我们预计社区驱动的实施/使用会偏向于一种方法而不是另一种方法(可能会考虑到与GData和CMIS的兼容性,或者更倾向于ORE的语义web方法)。随后,我们可以使用这些信息来推导基于最佳实践的SWORD规范。

3/客户端和服务器应如何就edit-media链接(EM-URI)返回的内容格式进行协商

内容协商问题是由于AtomPub最多需要一个具有给定类型的edit-media URI才能在Atom条目(存款收据)中可用。由于SWORD服务器可能包含多个文件,而不是AtomPub假定的一个文件,因此该EM-URI在GET下返回的内容尚不清楚。我们最初考虑了两种方法:

a/单独的HTTP标头,如Accept-Packaging,允许在包格式上进行内容协商
b/单独的HTTP头,如Accept-Media Features,允许在功能集上进行常规内容协商

正如我们所讨论的,这两种方法都有优缺点,而且没有一种方法以任何最佳实践为标志,这使得项目团队不愿意致力于任何过于复杂或实质性的事情,从而危及SWORD的简单性和整体成功。相反,我们建议采用更简单的方法:

存款凭证可以包含已经包含的剑:包元素(根据sword 1.3),sword 2计划允许任意数量的此类元素。这些元素将描述服务器支持的打包格式,以便客户端提前知道服务器的功能是什么。因此,客户端将只指定一个单独的HTTP标头,指示应返回的包格式,而不是参与内容协商过程。此标头是重新使用存放期间使用的Packaging标头,还是指定新标头尚待确定。

希望这些方法对团队有意义。我们很感兴趣的是,您认为这些在项目期间以及以后在社区中会发生什么,以及我们在这里提出的SWORD前进道路是否存在任何明显的问题。

一切顺利,

理查德
(SWORD项目团队的后手)

类别
SWORD第2版

SWORD技术咨询小组

作为SWORD v2开发的一部分,成立了一个技术咨询小组。该小组由来自SWORD和通用数字存储库领域的专家以及相关领域的专家组成。该小组的目的是确保该标准的制定符合其用户群体的需求,展示互联网标准领域的最佳实践,确保开发人员能够使用该标准,它试图做到通用性,以便在保持对存储库资源存放的关注的同时,与其他类型的系统进行互操作。该小组由来自大学、国家图书馆、研究资助者、商业公司、开发人员、存储库领域专家和存储库管理员的人员组成。

以下人员慷慨捐赠了他们的时间和专业知识,参加了本次会议:

  • Julie Allinson(约克大学)
  • 蒂姆·布罗迪(南安普顿大学)
  • 巴勃罗·德卡斯特罗(SONEX/马德里卡洛斯三世大学)
  • 查尔斯·邓肯(内部收款)
  • Reinhard Engels(哈佛大学图书馆)
  • 大卫·弗兰德斯(JISC)
  • 约翰·费恩斯(辛)
  • Kathi Fletcher(Shuttleworth基金会研究员)
  • 史蒂夫·希区柯克(南安普顿大学)
  • 杰森·霍伊特(门德利)
  • Bill Ingram(伊利诺伊大学厄巴纳-香槟分校)
  • 理查德·琼斯(SWORD技术主管)
  • 格雷厄姆·克莱恩(牛津大学)
  • Stuart Lewis(SWORD社区经理/奥克兰大学图书馆)
  • Mark MacGillivray(开发人员)
  • 安德烈亚·马奇泰利(CILEA)
  • Alistair Miles(惠康人类遗传学信托中心)
  • Ben O'Steen(开发人员)
  • 格伦·罗布森(威尔士国家图书馆)
  • 理查德·罗杰斯(麻省理工学院)
  • 罗伯特·桑德森(LANL)
  • Peter Sefton(南昆士兰大学澳大利亚数字期货研究所)
  • 尼克·谢泼德(UKCoRR/Leeds Metropolitan)
  • Eddie Shin(MediaShelf)
  • Alec Smecher(公共知识项目)
  • 阿德里安·史蒂文森(英国)
  • 伊恩·斯图尔特(Repository Junction/EDINA)
  • Ed Summers(国会图书馆)
  • David Tarrant(南安普顿大学)
  • 罗宾·泰勒(爱丁堡大学)
  • Graham Triggs(生物医学中心)
  • Alex Wade(微软外部研究)
  • 保罗·沃克(英国)
  • 西蒙·华纳(arXiv)
  • 斯科特·威尔逊(CETIS)
  • Nathan Yergler(创意共享)

为了实现开放性,小组讨论将存档在开放邮件存档中:http://www.mail-archive.com/sword-app-techadvisorypanel@列表.sourceforge.net/