W3C公司

从语言方言中提取资源描述(GRDDL)

W3C建议2007年9月11日

此版本:
http://www.w3.org/TR/2007/REC-grddl-20070911/
最新版本:
http://www.w3.org/TR/grddl/
上一版本:
http://www.w3.org/TR/2007/PR-grddl-20070716/
编辑:
丹康纳利
作者:
看见致谢

请参阅勘误表对于本文件,可能包括一些规范性更正。

另请参见翻译.


摘要

GRDDL是一种用于G公司倾向R(右)资源D类描述来自D类第节语言。这个GRDDL规范引入了基于现有标准的标记声明XML文档包含与资源描述框架(RDF)和用于链接到算法(通常用XSLT表示),用于从文档。

该标记包含一个命名空间限定属性以供使用在通用XML文档和限定概要文件中用于有效XHTML文档的链接关系。GRDDL该机制还允许XML命名空间文档(或XHTML配置文件文档)声明包含可收集数据的命名空间(或概要文件)链接到用于收集数据的算法。

A对应GRDDL用例工作草稿提供了令人鼓舞的示例。一个全球存托凭证底漆演示XHTML文档上的机制,其中包括被称为微格式的广泛部署的方言。一个GRDDL测试用例文档说明本设计中的具体问题,并为帮助测试驱动开发GRDDL敏感试剂。

本文件的状态

本节描述了该文档当时的状态其出版日期。其他文件可能取代本文件。一个当前W3C出版物列表及其最新版本技术报告可以在W3C技术报告索引http://www.w3.org/TR/。

这是一个W3C公司建议.

本文档已由W3C成员通过软件进行审查开发人员,以及其他W3C团体和相关方经局长批准为W3C推荐标准。这是一个马厩并可用作参考材料或引自他人文档。W3C在制定建议中的作用是引起人们的注意并促进其广泛部署。这个增强了Web的功能和互操作性。

对本文件的评论应发送至public-grddl-comments@w3.org带有公众的档案文件.

本文件由GRDDL工作组它是W3C公司语义Web活动。本文档的第一个版本是工作草案于2006年10月24日发布,工作组已经解决了许多问题评论收到问题从那时起。标记了规范性断言以这种方式向上。

工作组的实施报告证明了互操作的目标实现,设置在2007年5月候选人本文件建议草案实现了。

GRDDL旨在帮助解决Web架构问题诸如RDFinXHTML-35型命名空间文档-8、和xml函数-34以及RDF核心推迟的问题工作组,如rdfms-验证-嵌入式-rdffaq-html合规性.特别是,GRDDL工作组推迟发布-失效-失效并预计TAG问题的解决xml函数-34将提供进一步的澄清和指导。

本文件由一个集团编制2004年2月5日W3C专利政策. W3C维护了一个任何专利披露的公开列表与集团的可交付成果相关;该页面还包括披露专利的说明。对个人认为包含的专利具有实际知识的个人基本索赔必须按照W3C专利政策第6节.

这个问题附录过去的已将此草稿的一部分移至工作集团问题列表; 明确地:发行股票发行-输出格式发行基础参数issue-tx元素发布-html-nsdoc发布-失效-失效发布mt-ns发布符合性标签issue-http-header-links链接

目录

  1. 介绍
  2. 将GRDDL添加到格式良好的XML
  3. XML命名空间的GRDDL
  4. 使用带有有效XHTML的GRDDL
  5. HTML配置文件的GRDDL
  6. GRDDL转换
  7. 支持GRDDL的代理
  8. 安全注意事项
  9. GRDDL词汇
  10. 工具书类
链接的文档:

1简介:数据和文件

有许多特定领域的语言(“方言”)用于在web上的许多XML文档中进行实践。有方言XHTML、XML和RDF,用于表示从诗歌到散文,从采购订单到发票,从电子表格到数据库、模式到脚本,以及链接列表到本体。

虽然这种广度的表达方式相当自由,令人鼓舞方言代表信息,它可以成为跨领域理解的障碍,或领域。例如,软件是如何发现诗歌作者的,电子表格和本体?软件如何确定事实上,每一本书的作者都是一样的?

以下是相同音乐作品的示例用不同的XML方言描述:

iTunes音乐库
艺术家Jimi Hendrix体验相册<string>你有经验吗</字符串>
听觉障碍器
<相册>Jimi Hendrix体验<name>你有经验吗</名称>...</相册>
原子
<条目…><title>你有经验吗</标题><作者>Jimi Hendrix体验</author>...</entry>
开放式办公室
<office:文档元…><办公室:meta><dc:title>你有经验吗</dc:标题><meta:initial-creator>吉米·亨德里克斯经验</meta:initial-creator>Jimi Hendrix体验</office:meta></office:document-meta>

尽管上述示例显然是对相同信息的编码,计算机软件还没有明确的机制可能能够确定此连接。

资源描述

资源描述框架【RDFC04】提供了一个标准,用于对表单中的资源进行陈述主语-谓语-宾语表达式。一种表示事实”你有经验吗?他的艺术家是吉米·亨德里克斯RDF中的“体验”是一个三重元素,其主题是你是吗经验丰富,其谓词为“has artist”,其对象为是Jimi Hendrix体验。谓词“has artist”表示主题(你有经验吗?)和对象(Jimi Hendrix体验)。使用URI唯一标识专辑、艺术家甚至关系都会促进软件设计,因为不是每个人都知道Jimi Hendrix体验甚至连名字的拼写都是一致的。

这是上面的XML片段中包含的信息时间表示为RDF:

<rdf:rdfxmlns:foaf=“http://xmlns.com/foaf/0.1/"xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc=“http://purl.org/dc/engins/1.1/"><rdf:描述rdf:关于="http://musicbrainz.org/mm-2.1/album/6b050dcf-7ab1-456d-9e1b-c3c41c18eed2"><dc:title>你有经验吗</dc:标题><foaf:制造商><foaf:代理rdf:关于="http://musicbrainz.org/mm-2.1/artist/33b3c323-77c2-417c-a5b4-af7e6a111cc9">Jimi Hendrix体验</foaf:代理></foaf:maker></rdf:说明></rdf:rdf>

实体(主题和对象资源)和关系(谓词)使用明确的URI进行标识。

注意,GRDDL在使用时遵循HTML4、RDF和XML模式国际化资源标识符,即IRI[参考编号:RFC3987]非正式使用时,本规范使用了更熟悉的术语URI(URI)可与最近标准化的术语互换IRI公司,的正式规则精确地使用了相关术语。

上述XML的发布者也可以在RDF使用RDF/XML或其他RDF语法之一。GRDDL提供了一种相对廉价的引导机制来自统一XML方言的RDF内容,将负担从制定RDF以创建专门用于每种方言。

GRDDL通过关联通过直接引用或间接通过概要文件和命名空间文档。内容作者可以指定从内容生成RDF的转换并使用GRDDL引用它们。

忠实的格式副本

通过指定GRDDL转换,文档的作者声明转换将在表示的信息(或部分信息)的RDF通过源文档中使用的XML方言。

同样,通过指定GRDDL命名空间转换或配置文件转换,名称空间或概要文件的创建者声明该转换将提供一个类的忠实RDF格式与该名称空间或概要文件相关的源文档。一个命名空间文档或概要文件文档还提供了他们的作者用散文解释转换的目的或任何政策声明。

前言和伴随文件

本GRDDL规范是GRDDL机制及其XML语法。它指定了GRDDL语法在有效的XHTML和格式良好的XML文档中使用,以及如何将GRDDL编码为名称空间和HTML配置文件。讨论GRDDL转换链接和安全问题覆盖。附录提供了扩展示例和现有示例的链接使用GRDDL的软件和服务。

GRDDL底漆

GRDDL底漆[底漆]是关于GRDDL机制。它从GRDDL用例文档,用于说明以下方面的GRDDL技术将文档与提取RDF的转换相关联。

GRDDL用例

用例文档[用例]收集用例数量及其目标和要求GRDDL公司。这些用例还说明了XML和XHTML文档如何用微格式、嵌入式RDF或RDFa语句进行修饰以支持GRDDL转换负责提取有价值的数据然后用于自动化各种任务。

GRDDL测试用例

GRDDL测试用例[GRDDL测试]提供了一组说明此规范的测试。一些测试可能有助于澄清预期阅读规范性文本。

2将GRDDL添加到格式良好的XML

将GRDDL转换链接与格式良好的XML文档正在向根元素添加格德尔命名空间声明和grddl:转换值为IRI的属性引用或IRI引用列表,引用可执行脚本或将源文档转换为RDF。此方法适用于以下任何XML方言:在根上容纳一个额外的命名空间限定属性元素。

例如,此XML文档,位于http://www.w3.org/2001/sw/grdl-wg/td/titleauthor.html链接到两个GRDDL转换:

<html xmlns=“http://www.w3.org/1999/xhtml"xmlns:grddl='http://www.w3.org/2003/g/data-view#'
      grddl:transformation=“glean_title.xslhttp://www.w3.org/2001/sw/grddl-wg/td/getAuthor.xsl"><头部><title>你有经验吗</标题>[...]</html>
  1. 它与由http://www.w3.org/2001/sw/grddl-wg/td/getAuthor.xsl.
  2. 解析相对URI引用格伦_标题.xsl对于绝对形式,我们使用此XML元素的基URI,http://www.w3.org/2001/sw/grdl-wg/td/titleauthor.html.然后,本文档也链接到GRDDL转换以绝对形式标识,http://www.w3.org/2001/sw/grddl-wg/td/glean_title.xsl.
图表:链接到多个转换

提取标题和作者信息

(svg公司)

正如您将在后面的部分中看到的,还有其他方法可以添加GRDDL到HTML文档,特别是为利用HTML的现有功能而设计的从而克服了XML DTD对某些HTML方言的限制。请参见使用带有有效XHTML的GRDDLHTML配置文件的GRDDL.

下面给出了该标记的正式规范。每个规则的信息性机械版本都有前提结论写为SPARQL图形模式[SPARQL]。请参阅机械规则名称空间前缀绑定附录及其他解释。这些都是为那些觉得有帮助的读者准备的。鼓励其他读者忽略它们。

规范性声明机械规则
(资料性)
给定XPath[XPATH]节点N个带有根元素E类如果表达式
/*/@*[local-name()=“转换”和命名空间-uri()="http://www.w3.org/2003/g/data-view#"]
匹配的属性元素E类,然后针对每个空间分隔的代币 裁判在该属性的值中,资源已识别[韦伯奇]绝对形式(参见第5.2节相对分辨率[RFC3986])第页,共页裁判关于基本IRI[参考编号:RFC3987][XMLBASE]属于E类是一个GRDDL转换属于N个.

空格分隔标记是最大非空值不包含空格字符#x9、#xA、#xD或#x20之间。

(?N“/*”)gspec:xpath?E.公司。(?N“”“/*/@*[local-name()=“转换”和命名空间-uri()="http://www.w3.org/2003/g/data-view#“]”“)gspec:xpath[fn:string?V]。?Vfn:规范化空间?V规范。(?Vnorm“[\t\r\n]+”)fn:标记化[列表:成员?参考]。?E fn:基本单位?底座。(?REF?BASE)fn:解析uri?TXURI。?TX日志:uri?德克萨斯州。

?N grddl:转型?德克萨斯州。

这个格伦_标题.xsl变换计算以下RDF/XML文档,给定XML文档作为输入:

<rdf:rdf xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc=“http://purl.org/dc/elements/1.1/"><rdf:描述rdf:about=“”><dc:title>你有经验吗</dc:标题></rdf:说明></rdf:rdf>

该文档序列化的图形是GRDDL结果属于由标识的资源http://www.w3.org/2001/sw/grdl-wg/td/titleauthor.html.注意该图的序列化包含相对URI引用(以rdf:关于属性)。基本IRI在的序列化中解释相对IRI引用GRDDL转换生成的图形是源的基本IRI文档。

这个格伦_标题.xslresource从中指定函数XPath文档节点到RDF/XML文档,从而到RDF图;此函数称为变换特性XSLT的文档。请参阅GRDDL转换部分了解更多详细信息。

将GRDDL与格式良好的XML一起使用的一般规则是:

如果信息资源([韦伯奇]第2.2节)红外由带有的XML文档表示XPath根节点R(右)R(右)具有GRDDL转换用一个变换特性 总发电量, 总发电量应用于R(右)给出了一个RDF图【RDFC04】 G公司,然后G公司是一个GRDDL结果属于红外.
?IR日志:uri[fn:doc?R]。?R grddl:转换[grddl:转换属性?TP]。?R?(右)?TP?G.公司。

?IR grddl:结果?G、。

这个titleauthor.html资源有另一个GRDDL结果通过获取作者.xsl转型。这些可以通过以下方式将结果合并到另一个结果中此规则:

如果F类G公司GRDDL结果属于红外然后合并 【RDF-MT】属于F类G公司也是一个GRDDL结果属于红外.
?IR grddl:结果?F、 ?G.公司。(?F?G)log:连接?H。

?IR grddl:结果?H。

三。在XML命名空间文档中使用GRDDL

转型不仅与个人相关文档,但也使用共享XML名称空间的整个方言。任何可从命名空间URI检索的资源都是命名空间文档(参见第节4.5.4. 命名空间文件在里面[韦伯奇]). 例如命名空间文档可以有XML模式表示或RDF模式表示,或者两者都使用内容谈判.

要将GRDDL转换与整个方言相关联,请包括grddl:namespaceTransformation(名称空间转换)GRDDL中的属性命名空间文档的结果。

例如,考虑P3Q中编写的此隐私策略P3P人工模拟[第三页]:

<POLICIES xmlns=“http://www.w3.org/2004/01/rdxh/p3q-ns-example"><EXPIRY max-age=“604800”/>...

P3Q的命名空间文档将grokP3Q.xsl公司转换为所有P3Q文档:

<rdf:rdfxmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dataview=“http://www.w3.org/2003/g/data-view#"><rdf:描述rdf:about=“http://www.w3.org/2004/01/rdxh/p3q-ns-example"><数据视图:命名空间转换rdf:resource=“http://www.w3.org/2004/01/rdxh/grokP3Q.xsl"/></rdf:说明></rdf:rdf>

即:根命名空间名称为…p3q-ns示例grokP3Q.xsl公司作为一个GRDDL转换隐式地,如图所示在该图中:

图:通过名称空间收集
应用于命名空间的转换
(svg公司)

一些名称空间文档,例如XHTML名称空间文档http://www.w3.org/1999/xhtml有很多关于他们。如果GRDDL-aware代理每隔当他们处理引用他们的文档时,源服务器其中的文件可能会超载。支持GRDDL的代理因此,不应在每次引用和应该保留转换的一些缓存或本地内存文件表明应该应用。为了避免误传发布的信息,GRDDL感知代理应确保本地内存是最新的,应该支持用户选择配置或禁用缓存。另请参见章节3.1. 使用URI访问资源属于[韦伯奇].

命名空间转换的一般情况是:

规范性声明机械规则
(信息性)
如果
  • 信息资源美国国家标准文件,由IRI识别NS公司有一个GRDDL结果包括一个三元组谁的
    • 主题是国家科学与发展委员会,谁的
    • 谓词是属性<http://www.w3.org/2003/g/data-view#namespaceTransformation网站>和谁的
    • 对象是德克萨斯州
  • 和信息资源红外具有具有的XML表示形式根节点节点和带有根元素具有命名空间名称NS公司
然后德克萨斯州是一个全球存托凭证转型属于节点.
?NSDOC日志:uri?NS;grddl:结果[日志:包括[rdf:主题?NSDOC;rdf:谓词grddl:namespaceTransformation;rdf:对象?发送]]。?IR日志:uri[fn:doc?节点]。(?节点“/*”)gspec:xpath?E.公司。?E fn:namespace-uri?挪威。

?节点grddl:转换?德克萨斯州。

注意,作为基本情况,解析RDF/XML的结果文件是该文件的GRDDL结果:

规范性声明机械规则
(信息性)
如果信息资源红外代表符合RDF/XML文档[RDFX]然后是该文档表示的RDF图是一个GRDDL结果属于红外.
?IR日志:uri[fn:doc[gspec:rdfParse?G]]。

?IR grddl:结果?G.公司。

请注意,虽然应用程序/rdf+xml媒体类型为一表示文档是RDF/XML,第节7.2.1语法开始属于[RDFX]叶片打开“其他方式”,通过该方式可以识别RDF/XML文档。对于上述规则的目的,其本地名称为RDF公司和其命名空间URI是http://www.w3.org/1999/02/22-rdf-syntax-ns#是这样的手段。有关一个恰当的例子,请参阅grddlonrdf-xml媒体类型测试用例。

示例:对XML模式使用GRDDL命名空间文档

通过转换可以发现命名空间转换链接命名空间文档本身。注意,这意味着名称空间文档不需要直接用RDF/XML编写。

考虑一个具有名称空间文档的采购订单用XML模式表示,其中XML模式承载数据视图:转换包含以下内容的语句的属性许可提取命名空间转换声明:

<xsd:schema xmlns:xsd=“http://www.w3.org/2001/XMLSchema"xmlns=“http://Order-1.0”targetNamespace=“http://Order-1.0”版本=“1.0”...xmlns:data-view=“http://www.w3.org/2003/g/data-view#"data-view:transformation=“http://www.w3.org/2003/g/embeddedRDF.xsl" ><xsd:element name=“Order”type=“OrderType”><xsd:注释<xsd:documentation>此元素是根元素</xsd:文档></xsd:annotation>...<xsd:annotation><xsd:appinfo><rdf:rdf xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"><rdf:描述rdf:about=“http://www.w3.org/2003/g/po-ex"><数据视图:namespaceTransformationrdf:resource=“grokPO.xsl”/></rdf:说明></rdf:rdf></xsd:appinfo></xsd:annotation>...

使用该模式作为名称空间文档的每个采购订单链接到grokPO.xsl公司转换,作为如下图所示:

图:通过名称空间收集

将GRDDL与XML架构一起使用

(svg公司)

4使用带有有效XHTML的GRDDL

为了适应XHTML基于DTD的语法[XHTML(XHTML)],这排除了使用属性外部名称空间,我们使用http://www.w3.org/2003/g/data-view作为元数据配置文件(参见第节7.4.4.3元数据配置文件属于[HTML4]).

将GRDDL断言添加到有效XHTML的一般形式文档是通过在轮廓的属性元素,和转型作为相对属性链接元素,其href公司属性值是一个IRI引用,它引用用于转换源代码的可执行脚本或程序文档转换为RDF。此方法适合使用使用受XML DTD约束的有效XHTML文档。

都柏林核心META转换示例

例如,本文档遵循以下惯例[RFC2731],它显式使用GRDDL配置文件和指向XSLT转换的链接RDF/XML来表示转换是忠实的格式副本:

<html xmlns=“http://www.w3.org/1999/xhtml"><头部profile=“http://www.w3.org/2003/g/data-view网站"><title>一些文档</title><链接rel=“转换”href=“http://www.w3.org/2000/06/dc-extract/dc-extract.xsl" /><meta name=“DC.Subject”content=“ADAM;简单搜索;索引+;原型”/>...</头>...</html>

下图显示了源文档dc-提取.xsl转换和GRDDL结果:

图表:到转换的链接

将HTML元数据解码为RDF

(svg公司)

这是RDF/XML中的数据:

<rdf:rdf xmlns:dc=“http://purl.org/dc/elements/1.1/"xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"><rdf:描述rdf:about=“”><dc:subject>ADAM;简单搜索;指数+;原型</dc:subject></rdf:说明></rdf:rdf>

XHTML中的多重转换

XHTML文档可能符合多种方言同时链接到多个GRDDL转换。然而,自从href公司的属性链接元素只接受一个IRI引用,多个这些元素的实例必须用于断言多个链接:

<!DOCTYPE html PUBLIC“-//W3C//DTD XHTML 1.0严格//EN”"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.DTD"><html xmlns=“http://www.w3.org/1999/xhtml"><头部轮廓=“http://www.w3.org/2003/g/data-view网站">Joe Lambda的主页[XHTML中RDF的示例]<link rel=“转换”href=“http://www.w3.org/2003/12/rdf-in-xhtml-xslts/grokFOAF.xsl" /><link rel=“转换”href=“http://www.w3.org/2003/12/rdf-in-xhtml-xslts/grokCC.xsl" /><link rel=“转换”href=“http://www.w3.org/2003/12/rdf-in-xhtml-xslts/grokGeoURL.xsl" />...
图表:链接到多个转换

多次变换

(svg公司)

具有有效XHTML的GRDDL规则

一般规则是:

给定XPath根节点N个,如果N个元数据配置文件名称 http://www.w3.org/2003/g/data-view,然后对于每个链接后代元素E类谁的 相对属性[HTML4]转型作为其之一分隔的空间由绝对形式的href公司关于基本IRI的属性E类是一个GRDDL转换属于N个.
?N gspec:profileName“http://www.w3.org/2003/g/data-view".(?否“”“.//*[namespace-uri()=”http://www.w3.org/1999/xhtml“和(local-name()=“a”或local-name()=“link”)“”)gspec:xpath?E.公司。(?E“@rel”)gspec:xpath[fn:string[fn:规范化空间?E_REL]]。(?E_REL“[\t\r\n]+”)fn:标记化[列表:成员“转换”]。(?E“@href”)gspec:xpath[fn:string?T_REF]。?E gspec:htmlBase?底座。(?T_REF?BASE)fn:解析uri?图里。?日志:uri?图里。

?N grddl:转型?T。

注意,XHTML文档中元素节点的基本IRI可以受到诸如基础要素[HTML4] 检索URI(URI)RFC3986协议等。请参阅基本IRI考虑事项附录和测试用例,如html基础1以便进一步澄清。

上述规则取决于以下形式化XHTML中的元数据配置文件:

给定XPath根节点N个XHTML文档的(即,根元素具有的本地名称html格式和命名空间名称http://www.w3.org/1999/xhtml)对于每个空间分隔的代币 裁判的值轮廓属性[HTML4]要素E类的绝对形式裁判关于基本IRIE类是一个元数据配置文件名称属于N个.
(?否"""*[local-name()=“html”和namespace-uri()=“http://www.w3.org/1999/xhtml"] /*[local-name()=“head”和namespace-uri()=“http://www.w3.org/1999/xhtml"]""")gspec:xpath?E.公司。(?E“@profile”)gspec:xpath[fn:string?V]。?E fn:基本单位?底座。?Vfn:规范化空间?V标准。(?Vnorm“[\t\r\n]+”)fn:tokenize[列表:成员?P_REF]。(?P_REF?BASE)fn:解析uri?简介。

?N gspec:profileName?简介。

5HTML配置文件的GRDDL

XHTML提供了链接到属性含义的配置文件机制以及这些属性的合法值集。与命名空间文档一样,使用XHTML和嵌入的RDF语句可以有效地编写配置文件文档和GRDDL转换,以提取适用术语的定义。然后,可以在XHTML文档中使用这些术语来传递与配置文件相关的含义。如中所述使用带有有效XHTML的GRDDL,可以使用GRDDL配置文件使用XHTML文档将GRDDL语义应用于链接元素,其中的价值相对属性为转型.这种功能强大且灵活的机制与微格式配置文件[MF-RDF-FAQ]覆盖了通常语义较差的HTML标记。

下图显示了XFN文档[XFN]friends.html(好友.html)与关联grokXFN.xsl公司通过XFN配置文件间接进行转换。

图:通过概要间接链接的转换

间接通过配置文件

(svg公司)

添加GRDDL配置文件转换断言配置文件文档非常类似添加命名空间转换对命名空间的断言文件。对于由有效XHTML配置文件定义的方言文档,添加profile=“http://www.w3.org/2003/g/data-view"元素并创建类型的链接配置文件转换转变方言。

一般规则是:

如果
  • 信息资源PDOC公司,由IRI识别PNAME公司有一个GRDDL结果包括一个三元组谁的
    • 主题是PDOC公司,谁的
    • 谓词是属性<http://www.w3.org/2003/g/data-view#profileTransformation网站>和谁的
    • 对象是德克萨斯州
  • 和信息资源红外具有具有的XML表示形式XPath根节点节点有一个元数据配置文件名称 PNAME公司
然后德克萨斯州是一个全球存托凭证转型属于节点.
?PDOC日志:uri?PNAME;grddl:结果[日志:包括[rdf:主题?PDOC;rdf:谓词grddl:profileTransformation;rdf:对象?发送]]。?IR日志:uri[fn:doc?NODE]。?节点gspec:profileName?PNAME(人名)。

?节点grddl:转换?德克萨斯州。

6GRDDL转换

如上所述,每个GRDDL转换都指定一个转换特性,XPath文档节点的函数到RDF图。此功能无需为总计;它的域可能比所有XML文档都小节点。例如,使用xsl:message(xsl:消息)具有terminate=“是”可以用来表示输入在转换的域之外。

转换开发人员应该提供可用的表示以广泛支持的格式。XSLT版本1[XSLT1]是GRDDL-aware最广泛支持的格式尽管XSLT2[XSLT2]部署正在增加。虽然技术上是Javascript、C或几乎任何其他编程语言可以用来表示GRDDL的转换,XSLT是专门用于表达XML到XML的转换一些良好的安全特性;XQuery具有类似的特性到XSLT,尽管在GRDDL实现中使用XQuery在撰写本文时部署得不太广泛。

如果
  • RDFXML(RDFXML)是的根XPath节点符合RDF/XML文档[RDFX]表示RDF图的G公司、和
  • R(右)是某些XML文档的根节点TXNODE公司是的根节点XSLT转换[XSLT1]、和
  • RDFXML(RDFXML)是的根节点XSLT结果树TXNODE公司应用于R(右)、和
  • TXDOC公司是一个信息资源具有变换特性 总发电量由XML文档表示具有根节点TXNODE公司
然后总发电量关联R(右)G公司.
?RDFXML gspec:rdfParse?G.公司。(?TXNODE?R)gspec:resultTree?RDFXML中。?TXDOC grddl:转换属性?TP;log:uri[fn:doc?TXNODE]。

?R?(右)?TP?G公司

上述规则适用于转型财产通过将XPath文档节点与RDF图关联RDF/XML文档。转换可以使用其他未指定的,机制。例如,请参见测试#原子t1,其中媒体类型属性xsl:输出元素的“text/rdf+n3”值为指示“application/rdf+xml”以外的媒体类型。GRDDL代理可以处理此类媒体类型的,然后可以在中生成RDF图根据媒体类型。非XSLT变换可能表示RDF图以其他未指定的方式显示。

目前,当一个信息资源由XML文档表示相应的XPath数据模型可能无法完全确定,具体取决于例如,关于代理是否详细说明包含、参数实体、固定属性和默认属性,或检查数字签名。换句话说,如果作者对信息负责在XML文档中,作者究竟获取了哪些信息责任?作者如何确保GRDDL转换能够满足GRDDL的忠实的格式副本保证?

该规范没有提及哪个XML处理器由或用于支持GRDDL的代理。是否XInclude处理、XML有效性、XML模式有效性和XML进行签名或XML解密当前未指定。然而,本规范预计TAG问题的解决xml函数-34以及定义,通过XML处理模型工作默认处理模型的澄清和指导,以及GRDDL感知代理如果发布了此类指导,请遵守。没有普遍期望XSLT处理器将在执行GRDDL之前调用此类处理转型。因此,建议GRDDL转换编写,以便执行所有预期的预处理,包括处理相关DTD、模式和命名空间。这种措施可以对于不需要预处理的文件,应避免生成一个可靠的信息集。也就是说,对于不参考XInclude、DTD、XML Schemas等。

文档作者,特别是XHTML文档作者,希望在与GRDDL一起使用时其文档明确无误应避免依赖外部DTD子集;明确地:

XProc:一种XML管道语言[西太平洋铁路公司]一种描述操作的语言在XML文档上执行,最近发布为W3C工作草案。值得考虑表达更多需要控制的复杂或复杂转换通过各种XML处理工具进行处理的流程。使用XProc,可以应用一系列操作,如XInclude,验证,并转换为文档,如果结果为例如,中间阶段的属性无效。

7支持GRDDL的代理

一个GRDDL感知代理人是一个计算GRDDL结果属于信息资源。

例如,SPARQL查询服务可能使用GRDDL感知代理用于收集RDF数据。或者Web浏览器可以充当GRDDL感知用于收集日历和联系人数据的代理。这个适当的策略(计算结果以及计算时间)可能会在Web浏览器案例中,需要更多地等待用户的信号而不是在查询服务案例中。

从属于安全注意事项下方和配置中表示的本地策略,给定信息资源红外、和XPath节点N个代表红外支持GRDDL的代理应该:

  1. 查找与关联的每个转换N个,即。
    1. 与关联的每个转换N个通过grddl:转换属性,如将GRDDL添加到格式良好的XML部分
    2. 与关联的每个转换N个通过HTML类型的链接转型,前提是该文件带有这个http://www.w3.org/2003/g/data-view配置文件,如中所示这个使用带有有效XHTML的GRDDL部分。
    3. 由任何可用的命名空间指示的每个转换文档,如XML的GRDDL命名空间部分。
    4. 任何XHTML配置文件指示的每个转换,如中所示HTML配置文件的GRDDL部分。
  2. 有选择地将任何或所有发现的转换应用于获取GRDDL结果。票据选择可能由代理人指导功能、本地安全策略以及可能的用户/客户端干预。
  3. 合并这些GRDDL结果。

注意,通过名称空间或配置文件文档的发现是递归的;应检测配置文件/命名空间结构中的循环,以避免无限递归。

示例:支持GRDDL的代理协议跟踪

虽然GRDDL的声明性规范允许实现策略,在这个示例中,我们跟踪行为许多典型实现通用。

考虑一个GRDDL感知代理,它被要求从http://www.w3.org/2003/g/po-doc.xml。它开始于取消对URI的引用,注意RDF/XML、HTML和XML可接受的表示:

[00:00.000-从127.0.0.1:39645]开始的客户端连接GET(获取)http://www.w3.org/2003/g/po-doc.xmlHTTP/1.1协议主持人:www.w3.org接受:application/rdf+xml、application.xml、text/xml、applection/xhtml+xml、text/html[00:00-055-服务器已连接]HTTP/1.1 200正常上次修改时间:2004年12月7日星期二22:59:02 GMT内容物长度:1302内容类型:application/xml;qs=0.9<purchaseOrder orderDate=“1999-10-20”xmlns=“http://www.w3.org/2003/g/po-ex"><shipTo country=“US”>爱丽丝·史密斯<street>枫树街123号</street>...

返回的XML文档没有显式转换标记,但其中的规则XML命名空间部分建议从名称空间文档中查找结果:

[00:00.000-客户端连接从127.0.0.1:39647]GET(获取)http://www.w3.org/2003/g/po-exHTTP/1.1协议主持人:www.w3.org接受:application/rdf+xml、application.xml、text/xml、applection/xhtml+xml、text/html[00:00.051-服务器已连接]HTTP/1.1 200正常内容-位置:po-ex.xsd上次修改时间:2004年12月7日星期二23:18:25 GMT内容物长度:2624内容类型:application/xml;qs=0.9<xs:schema xmlns:xs=“http://www.w3.org/2001/XMLSchema"xmlns:po=“http://www.w3.org/2003/g/po-ex"targetNamespace=“http://www.w3.org/2003/g/po-ex"elementFormDefault=“合格”attributeFormDefault=“不合格”xmlns:data-view=“http://www.w3.org/2003/g/data-view网站#" data-view:transformation=“http://www.w3.org/2003/g/embeddedRDF.xsl"><xs:annotation><xs:appinfo><rdf:rdf xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"><rdf:描述rdf:about=“http://www.w3.org/2003/g/po-ex网站"><数据视图:namespaceTransformationrdf:resource=“grokPO.xsl”/></rdf:说明></rdf:rdf></xs:appinfo></xs:annotation>...

我们还没有RDF/XML文档形式的结果,但这次我们发现转型属性,因此我们遵循该链接,注意,我们接受XML表示:

00:00.000-客户端连接从127.0.0.1:39649]GET(获取)http://www.w3.org/2003/g/embeddedRDF.xsl网址:HTTP/1.1主持人:www.w3.org接受:应用程序/xml[00:00.054-服务器已连接]HTTP/1.1 200正常上次修改时间:2005年3月23日星期三18:49:12 GMT内容物长度:797内容类型:application/xml;qs=0.9<xsl:transform(转换)版本=“1.0”xmlns:xsl=“http://www.w3.org/1999/XSL/Transform网站"...

应用该转换将产生。。。

<rdf:rdfxmlns:data-view=“http://www.w3.org/2003/g/data-view#"xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"><rdf:描述rdf:about=“http://www.w3.org/2003/g/po-ex"><data-view:namespaceTransformation rdf:resource=“http://www.w3.org/2003/g/grokPO.xsl"/></rdf:说明></rdf:rdf>

…这告诉我们…/grokPO.xsl是的转换中的所有文档…/出口命名空间。

继续递归,我们检查名称空间文档对于邮箱.xsd。由于这是一个众所周知的命名空间文档,遵循安全注意事项部分我们注意到请求中缓存副本的最后修改日期,源服务器让我们知道我们的副本是最新的:

[00:00.000-客户端连接从127.0.0.1:39651]GET(获取)http://www.w3.org/2001/XMLSchemaHTTP/1.1协议主持人:www.w3.org接受:application/rdf+xml、application.xml、text/xml、applection/xhtml+xml、text/htmlIf-修改日期:2005年12月16日星期五14:19:38 GMT[00:00.047-服务器已连接]HTTP/1.1 304未修改内容位置:XMLSchema.html到期时间:2007年2月7日星期三15:09:29 GMTCache-Control:max-age=21600变化:协商、接受、接受

由于XML Schema命名空间文档的缓存副本显示没有关联的GRDDL转换,我们返回到命名空间转换po-ex公司grokPO.xsl公司:

[00:00.000-客户端连接从127.0.0.1:39653]GET(获取)http://www.w3.org/2003/g/grokPO.xslHTTP/1.1协议主持人:www.w3.org接受:application/xml[00:00.048-服务器已连接]HTTP/1.1 200正常上次修改时间:2004年12月7日星期二23:33:28 GMT内容物长度:1739内容类型:application/xml;qs=0.9<xsl:transform(转换)版本=“1.0”xmlns:xsl=“http://www.w3.org/1999/XSL/Transform网站"xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:po=“http://www.w3.org/2003/g/po-ex"xmlns:poF=“http://www.w3.org/2003/g/po-ex#"><xsl:output method=“xml”indent=“yes”/><div xmlns=“http://www.w3.org/1999/xhtml"><h1>grokPO.xsl——将采购订单格式解释为RDF</h1>...

将此转换应用于po-doc.xml文件产生RDF/XML;我们将其解析为RDF图(使用源文档的URI,http://www.w3.org/2003/g/po-doc.xml,作为基本URI)和返回图形作为的GRDDL结果po-doc.xml文件:

<rdf:rdfxmlns:poF=“http://www.w3.org/2003/g/po-ex#"xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#"><rdf:描述rdf:nodeID=“hOhqYGhx9”><poF:city>米尔山谷</poF:city><poF:state>CA</poF:state><poF:zip>90952</poF:zip>枫叶街123号Alice Smith</rdf:说明>...

HTTP跟踪数据是通过收集的TCP配线作者:Shane海瑟薇。有关更多详细信息,请参阅超文本传输协议GRDDL测试材料中的追踪.

8安全注意事项

通用编程语言的执行转换的解释器暴露了严重的安全风险。建议具有GRDDL感知功能的代理的设计者避免简单地向“离线”口译员发送GRDDL转换。While期间通过GRDDL转换,实现者应该考虑在添加执行任意GRDDL的功能之前从任意Web文档链接的转换。

与许多Web技术一样,GRDDL从根本上依赖于URI的去引用。建议GRDDL转换的编写者不要使用URL操作这是潜在的危险,因为这些操作更有可能在安全的GRDDL实现中不可用。执行GRDDL转换的软件建议要么完全禁用所有潜在危险的URL操作,要么特别注意不要将任何特殊权力委托给他们操作。特别地,使用关联的权限可以更安全地执行URL的读取或写入操作与不受信任的一方,而不是当前用户。此类禁用和/或检查应该完全超出转换语言本身的范围;应注意确保不存在重新启用全功能版本的方法这些操作符。

本节的其余部分概述了一些,但可能不是执行GRDDL转换时可能出现的所有问题,特别提到XSLT中的转换。

  1. 不受限制地使用GRDDL,不受信任转换可以访问最终用户已读或写的URL权限,而转换的作者没有权限。这是特别适用于来自文件的URL:scheme;但还有很多其他的计划也受到影响。不受信任的代码可能已读取作者无权访问、传输的文件通过对URL中可以传递给服务器的内容。
  2. XSLT语言中的危险操作包括但可能不是仅限于获取URL的操作:文档()文档()未分析文本()未分析的文本-可用()、和xsl:结果文档包括写入URL。xsl:include(包含)xsl:导入如果在之前进行处理,则风险较小执行转换,而不是在转换期间执行。
  3. 一些转换语言实现可能提供用于加载的工具以及执行其他编程语言代码。例如,XSLT实现可以提供执行Java代码的方法。这些设施显然容易被滥用。建议GRDDL转换的设计者不要使用这些特征。除了特定于实现之外,它们更有可能是在转换语言的安全实现中不可用。使用执行GRDDL转换的软件中的此类运算符应防止如果遇到这样的操作符。
  4. XSLT实现通常提供自己的扩展。建议GRDDL转换的设计者不要使用扩展因为它们不能保证在所有实现中都存在。执行GRDDL转换的软件应确保扩展安全且不构成任何威胁。
  5. 因为可以编写过度消耗系统资源的转换或者无限循环。这两种类型的转换都有可能导致损坏如果发送给不知情的收件人。建议GRDDL转换的设计者避免此类转变的构建和传播。执行GRDDL转换的软件应提供适当的机制在经过一段合理的时间后中止处理。此外,GRDDL软件的使用量应限制在合理的范围内任何给定系统资源的。
  6. 最后,转换语言的某些解释器中可能存在错误可能被利用以获得对收件人系统的未经授权访问。除了注意到这种可能性外,不建议采取任何具体措施来防止这种情况发生除了及时纠正发现的此类错误外。

9GRDDL词汇

以下内容摘自GRDDL配置文件/名称空间文件:

本文件,http://www.w3.org/2003/g/data-view是HTML规范意义上的元数据配置文件,在第节中7.4.4.3元数据配置文件.

下面的术语是作为XHTML链接关系引入的name和RDF属性名:

以下术语在此作为RDF属性介绍:

以下术语与现有标准中的概念相关:

命名空间文档包含有关GRDDL词汇表,但这些RDF数据不包括其谓词是grddl:配置文件转换.

在关于在XML命名空间中使用GRDDL文件,仅显式grddl:namespaceTransformation(名称空间转换)三元组满足规则的前提。同样,grddl:配置文件转换三元组必须在概要文件的GRDDL结果,以满足以下前提上一节中的规则GRDDL用于HTML配置文件建议GRDDL源文件的作者反对使用RDFS或OWL表达式,因为它们暗示了这样的三元组,但确实没有明确说明。

10工具书类

规范性引用文件

RFC3987号文件
国际化资源标识符(IRI)互联网RFC 3987 2005年1月。Suignard Duerst公司
RFC3986协议
统一资源标识符(URI):通用语法互联网RFC3986 2005年1月。伯纳斯-雷、菲尔丁、马斯特
WEBARCH公司
万维网架构,第一卷 ,N.Walsh,I.Jacobs,W3C建议书编辑,2004年12月15日,http://www.w3.org/TR/2004/REC-webarch-20041215/ .最新版本可在获取http://www.w3.org/TR/webarch/ .
RDFC04型
资源描述框架(RDF):概念和抽象语法 ,G.Klyne,J.J.Carroll,W3C建议书编辑,2004年2月10日,http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/ .最新版本可在获取http://www.w3.org/TR/rdf-conceptions网站/ .
RDF-MT公司
RDF语义 ,P.Hayes,W3C建议书编辑,2004年2月10日,http://www.w3.org/TR/2004/REC-rdf-mt-20040210/ .最新版本可在获取http://www.w3.org/TR/rdf-mt/ .
RDFX公司
RDF/XML语法规范(修订版),D.Beckett,W3C编辑2004年2月10日的建议,http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/ .最新的版本可在获取http://www.w3.org/TR/rdf-syntax-grammar .
XML数据库
XML基础 ,J.Marsh,W3C建议书编辑,2001年6月27日,http://www.w3.org/TR/2001/REC-xmlbase-20010627/ .最新版本可在获取http://www.w3.org/TR/xmlbase/ .
XHTML(XHTML)
XHTML™模块化 ,S.Schnitzenbaumer,F.Boumpriy,T.Wugofski,S.McCarron,M.Altheim,S.Dooley,W3C建议书编辑,2001年4月10日,http://www.w3.org/TR/2001/REC-xhtml-modulezation-20010410/ .最新版本可在获取http://www.w3.org/TR/xhtml-模块化/ .
HTML四
HTML 4.01规范 ,D.Raggett,A.Le Hors,I.Jacobs,编辑,W3C推荐,1999年12月24日,http://www.w3.org/TR/1999/REC-html401-19991224 .最新版本可在获取http://www.w3.org/TR/html401 .
XPATH公司
XML格式路径语言(XPath)1.0版 ,J.克拉克,S.J.DeRose,W3C建议书编辑,1999年11月16日,http://www.w3.org/TR/1999/REC-xpath-19991116 .最新版本可在网址:http://www.w3.org/TR/xpath .
XSLT1型
XSL转换(XSLT)1.0版 ,J.Clark,W3C建议书编辑,1999年11月16日,http://www.w3.org/TR/1999/REC-xslt-19991116 .最新版本可在获取http://www.w3.org/TR/xslt网站 .

参考资料

以下文件提供了额外的背景资料,但不是本规范的一部分。

底漆
全球存托凭证底漆 ,I.Davis,W3C工作草案(进行中)编辑,2006年10月2日,http://www.w3.org/TR/2006/WD-grddl-primer-20061002/ .最新版本可在获取http://www.w3.org/TR/grddl-primer网站/ .
用例
全球存托凭证用例:从XML中提取RDF数据的场景文件 ,F.Gandon,W3C工作组编辑注,2007年4月6日,http://www.w3.org/TR/2007/NOTE-grddl-scenarios-20070406/ .最新版本可在http://www.w3.org/TR/grdl-scenarios网站/ .
GRDDL测试
GRDDL测试用例 ,C.Ogbuji,W3C建议书编辑,2007年9月11日,http://www.w3.org/TR/2007/REC-grddl-tests-20070911/ .最新版本可在获取http://www.w3.org/TR/grddl-tests/ .
SPARQL公司
RDF的SPARQL查询语言 ,E.Prud'hommeaux,A.Seaborne,编辑,W3C工作草案(正在进行中),2007年3月26日,http://www.w3.org/TR/2007/WD-rdf-sparql-query-20070326/ .最新版本可在获取http://www.w3.org/TR/rdf-sparql-query/ .
XSLT2
XSL转换(XSLT)2.0版 ,M.Kay,W3C建议书编辑,2007年1月23日,http://www.w3.org/TR/2007/REC-xslt20-20070123/ .最新版本可在获取http://www.w3.org/TR/xslt20 .
RFC2731号文件
J.昆泽都柏林核心区编码HTML中的元数据1999年
XFN公司
XFN:简介和示例 版权所有GMPG 2003-2007。埃里克、坦特克和马特
DCRDF公司
用RDF/XML表示简单的都柏林核心Brickley Miller Beckett 2002年7月31日
第3页
隐私偏好平台1.0(P3P1.0)规范 ,M.Marchiori,W3C建议书编辑,2002年4月16日,http://www.w3.org/TR/2002/REC-P3P-20020416/ .最新版本可在获取网址:http://www.w3.org/TR/P3P/ .
STYPI公司
将样式表与XML文档关联 ,J.Clark,W3C建议书编辑,1999年6月29日,http://www.w3.org/1999/06/REC-xml-stylesheet-19990629 .最新版本可在获取http://www.w3.org/TR/xml-stylesheet .
XPROC公司
XProc:一种XML管道语言 ,N.Walsh,W3C工作草案(进行中)编辑,2006年9月28日,http://www.w3.org/TR/2006/WD-xproc-20060928/ .最新版本可在获取http://www.w3.org/TR/xproc/ .
MF-RDF-FAQ公司
RDF风扇的微格式常见问题解答,上次修改时间:2006年5月30日17:57

附录:样式转换与数据提取(资料性)

xml-stylesheet处理指令[STYPI]公司通常部署为自动化演示文稿处理。此类型的链接与到的链接不同GRDDL转换算法,旨在促进提取数据。此外,解析处理指令的内容XML工具(如XSLT处理器和接地)不支持在URI空间中处理指令并不像将名称空间与属性一起使用。

附录:基本IRI注意事项

将GRDDL添加到格式良好的XML第节,我们有:

用于在GRDDL转换生成的图的序列化是源文档的基本IRI。

这与RFC 3986相对应,尤其是第5.1节它说明了基本URI的标识,如下图所示:

.----------------------------------------------------------.|  .----------------------------------------------------.  ||  |  .----------------------------------------------.  |  ||  |  |  .----------------------------------------.  |  |  ||  |  |  |  .----------------------------------.  |  |  |  |||||<相对引用>||||||  |  |  |  `----------------------------------'  |  |  |  ||  |  |  | (5.1.1)内容中嵌入的基URI |||||  |  |  `----------------------------------------'  |  |  ||  |  | (5.1.2)封装实体的基URI ||||||(消息、表示或无)||||  |  `----------------------------------------------'  |  ||  | (5.1.3)用于检索实体的URI |||  `----------------------------------------------------'  ||(5.1.4)默认基本URI(依赖于应用程序)|`----------------------------------------------------------'

在典型的GRDDL处理期间,中间RDF/XML序列化是作为变换的输出产生。要将此序列化转换为RDF图,任何相关引用在序列化中解析为IRI用于解析给定相对参考的适当基础IRI,第一检查此RDF/XML中嵌入的基本URI,遵循RDF语法允许的XML Base。如果此RDF/XML中没有嵌入基URI,那么节RFC 3986第5.1.2条可能适用,因为封装实体此序列化的根元素是输入文档的根元素。如果此元素未定义基URI,然后对其进行封装实体,即输入文档,可以定义基本IRI。

原始文档可以是XHTML系列文档,或者它可能是其他XML文档。

XHTML系列文档的基本IRI

对于XHTML系列文档,输入文档的基本IRI可以指定为值href公司的属性<基础>元素(如果有)。这符合RFC 3986第5.1.1节的要求。

在许多其他情况下,第5.1.2节不适用,第5.1.3节适用确实适用。第5.1.3节规定了检索IRI作为基础IRI。此外,第5.1.3节RFC 3986规定:

如果检索是重定向请求的结果,使用的最后一个URI(即导致实际检索表示)是基URI。

生成的IRI用作处理的基本IRI参数中间RDF/XML序列化。

其他XML文档的基本IRI

其他XML文档可以使用XML Base。仅当特定文档格式允许使用XML Base。

xml:基础属性存在在XML文档的根元素上,此指定该文档的基本IRI,遵循RFC 3986第5.1.1节。

当没有xml:基础属性在根元素上,即使上有这样的属性子元素,则RFC 3986第5.1.1节不适用。

与XHTML一样,我们必须考虑部分RFC 3986第5.1.2、5.1.3和5.1.4条。

其中,第5.1.3节是最常见的情况,关于重定向检索的注释也适用。

处理管道中的基本IRI

GRDDL感知代理在以下情况下计算GRDDL结果

给定URI信息资源的红外、和XPath节点N个代表红外

要在处理管道中使用GRDDL感知代理,以及XPath节点N个,这也是必要的指定相应的IRI.当其他机制不适用。这对应于RFC 3986第5.1.4节。甚至可以使用默认的IRI来承载与XPath节点没有关系N个但在这种情况下,我们阅读:

由于此定义必然依赖于应用程序,如果使用其他方法之一无法定义基本URI,则可能会导致不同类型的应用程序对同一内容进行不同的解释。

包含相对引用的表示的发送方负责确保可以为这些引用建立基URI。

正确处理基础IRI的责任

文档作者,包括概要文件和命名空间文档

通常,文档作者应该包括一个基本URI如果文档可以从其他URI检索到。

对于XHTML系列文档[XHTML(XHTML)],这是使用基础元素。

对于其他XML文档,如果格式支持xml:基础那么应该使用这个。一般来说,经验表明在根元素上执行此操作时,混淆最少。文档作者也可以使用xml:基础属性在文件格式允许的情况下,具有XML Base定义的语义[XMLBASE].

对于格式不支持的XML文档xml:基础和不是XHTML系列文档,GRDDL中不支持指定内联基URI。

当可以通过多个URI访问配置文件或名称空间文档时,例如,通过重定向,文档作者通常应该,提供指定配置文件转换的GRDDL结果或每个URI的命名空间转换。

支持GRDDL的代理

当GRDDL结果以RDF/XML表示时使用RDF/XML规则此表示可能需要一个基本URI,以便进行转换按照RDF/XML语法规范中的规则,生成RDF图[RDFX].

以其他方式表示的GRDDL结果可能还需要一个基URI。

根据上面的分析,一个用于解析相对参考由RFC 3986第5.1节定义。

在许多应用中,这是非常不可取的GRDDL结果可能取决于应用程序默认URI,RFC 3986第5.1.4节;一些GRDDL感知代理可能会将这种可能性视为错误。

GRDDL转换作者

通常,在为编写GRDDL转换时将XHTML家族文档转换为RDF/XML最好的建议是忽略与基本URI有关的问题。最简单的方法是在输出中生成相对URI,对应于输入中的任何相对URI,和与内置的任何概念相对应的绝对URI转换。在处理过程中,将解析这些相对URI由支持GRDDL的代理针对正确的基URI执行。

为XML文档格式编写GRDDL转换时不支持xml:base,并且无法表示一个内嵌的基本URI,除了忽略问题之外别无选择正确的基础。

为XML文档格式编写GRDDL转换时,除了XHTML家族文档之外,它不支持xml:base,但具有其他表示方法内联基URI,则GRDDL感知代理将一无所知并且编写良好的GRDDL转换将尝试来纠正这一点。当以这种方式指定基URI时,一种方法是将基本URI插入RDF/XML输出中,如下所示的值xml:基础属性,以便RDF/XML解析器将根据该基解析相对URI,并忽略GRDDL感知代理传递的基本URI将忽略特定于此格式的约定进行计算。

为XML文档格式编写GRDDL转换时它确实支持xml:base,那么必须记住支持GRDDL的代理负责处理基于根元素的xml:base。如果有这样一个xml:base属性,那么最简单的GRDDL转换的行为是忽略它。

但是,其他xml:base属性(不在根元素上),是转换的责任,因为GRDDL知道代理忽略了这些。因此,应该遵循这些较低级别的xml:base属性,最简单的方法是将它们复制到输出图中在适当的地方。然而,一般来说,xml:祖先节点上的基本属性也必须考虑在内,除非有干预xml:base属性,其值为绝对URI。这显然是正确的:帮助,GRDDL库提供了一个要导入到样式表中的模块,请参见下文。

在所有情况下,虽然通常是不必要的,如果转换知道绝对值在其输入中为整个文档指定的基本URI,将此基本URI用作的基本URI从来都是正确的例如,通过添加适当的xml:基础属性到rdf:rdf元素。

这样做的转换需要防止可能不正确的相对基URI的类似处理。例如xml:base=“..”在根元素may上,在正确的GRDDL感知代理和写得不好的代理之间的交互转换,应用两次,导致相对引用在目录层次结构中的错误级别进行了解析。

确认和变更历史

一个同伴GRDDL设计历史和基本原理在HTML上下文中讨论此设计,自1997年起,PICS和RDF。编辑非常感谢社区成员在发展全球存托凭证:

GRDDL工作组于2006年8月召开会议,Harry Halpin担任主席和上面的几个贡献者和实现者参与,加上Chimezie Ogbuji、Fabien Gandon、Brian Suda和雷切尔·亚格(Rachel Yager)。

Jeremy Carroll根据副本请求2046并实现了Ian建议的HTTP头链接戴维斯。

工作组发布了2006年10月24日草案. The问题列表显示此后的主要设计决策。

自2007年7月16日发布以来的唯一更改状态部分包括: