超文本标记语言(HTML)欧洲核子研究中心Tim Berners-Lee中庭Daniel Connolly网络草稿IIIR工作组1993年6月超文本标记语言(HTML)文本信息和元信息的表示用于检索和交换本文件的状态本文件为互联网草案。Internet草稿正在工作互联网工程特别工作组(IETF)及其领域的文件,及其工作组。请注意,其他组也可以分发工作文档作为Internet草稿。互联网草稿是最多有效期为六年的工作文件月。Internet草稿可能会被更新、替换或作废其他文件。使用互联网是不合适的作为参考材料的草稿或引用它们而不是作为“工作草案”或“正在进行的工作”。此文档的分发是无限的。该文档是一个信息交换标准草案建议注册为MIME的网络(RFC1341)内容类型。请将评论发送至timbl@info.cern.ch讨论列表www-talk@info.cern.ch。这是本草案的1.2版。此文档位于全球网络上的超文本http://info.cern.ch/hypertext/WWW/MarkUp/HTML.HTML摘要超文本标记语言(HTML)可用于表示超文本新闻、邮件、在线文档和协作超媒体;选项菜单;数据库查询结果;具有内联图形的简单结构化文档。现有信息机构的超文本视图万维网(W3)倡议链接相关信息遍布全球。HTML为提供链接信息,所有与W3兼容的程序需要能够处理HTML。W3使用互联网Berners-Lee和Connolly 1 协议(超文本传输协议,HTTP),允许传输要在客户端和服务器之间协商的表示结果在扩展MIME消息中返回。HTML是因此,只有一个但很重要的表述与W3一起使用。HTML被提议作为MIME内容类型。HTML是指RFCxxxx的URL规范。HTML解析器和生成器的实现可以在公共域W3代码中的各种W3服务器和浏览器,以及也可以使用各种公共域SGML解析器构建,例如[SGMLS]。HTML是一种通用的SGML文档类型适用于表示来自广泛领域的信息的语义应用范围。它比许多特定的SGML更通用应用程序,但仍然完全依赖于设备。在本文件中本文件包含以下部分:本文件中使用的词汇、祈使程度。HTML和MIME,讨论字符集。HTML和SGML及其之间的关系,以及结构化文本:简介SGML初学者。HTML元素包含描述、示例和典型渲染。HTML实体用于描述字符的实体。HTML DTD HTML的SGML DTD文本链接关系值。临时名单。不属于标准。登记机关扩展有效列表的权限山谷。相关文件参考作者提供联系信息。目录词汇Berners-Lee和Connolly 2 本规范使用以下词语,含义准确给定。表示用于交换的信息编码。例如,HTML是超文本。将信息呈现形式呈现给人类读者。IMPERATIVES公司可能实施没有义务遵循无论如何都是这样。必须如果不遵守,则执行不符合本规范。应作为“必须”如果不遵循这一点,尽管实施正式符合标准,可能会出现不良结果实践。描述了许多典型的渲染元素。这不是标准,但作为以下方面的指导设计师和帮助解释这些元素的目的是什么。笔记标有“注:”的部分不是规范,但仅供参考。功能状态主流所有解析器都必须识别这些功能。功能是主流,除非另有规定提到。额外的标准HTML功能被解析器忽略。忽视是合法的这些,将内容视为标签没有。(例如EM和任何未定义的元素)过时的非标准HTML。解析器应实现为了保持与前一版本的向后兼容性本规范的版本。Berners-Lee和Connolly 3 HTML和MIMEHTML内容子类型的定义是MIME类型名称文本MIME子类型名称:html所需参数:无可选参数:charset字符集HTML的基本字符集(SGML BASESET)是ISO Latin-1。这是任何数字字符引用引用的集合。HTML表示中使用的实际字符集文档可以是ISO拉丁文1,也可以是其7位ASCII子集。HTML文档没有义务包含任何十进制127以上的字符。运输电子邮件等媒体对文档表示中的位,通过HTTP访问W3使用的协议总是允许8位传输。当HTML文档使用7位字符编码时字符引用和实体引用的机制可以是用于对ISO拉丁语-1集合上半部分中的字符进行编码。通过这种方式,可以编制适用于通过7位有限系统发送邮件。简介超文本标记语言是根据ISO定义的标准通用标记语言[]。SGML是一个用于定义结构化文档类型和标记语言表示这些文档类型的实例。每个SGML文档都有三个部分:SGML声明,它绑定SGML处理数量和将标记名语法为特定值。例如,SGMLHTMLDTD中的声明指定打开的字符串标签是 示例HTML实例

结构示例

这是一个典型的段落。

一些元素(例如P、LI)为空。他们没有内容。他们显示为一个开始标记。对于其余元素,内容是一系列数据字符和嵌套元素。请注意,HTML DTD实际上严重限制了允许的嵌套数量:大多数情况伯纳斯-李和康诺利5 事实上,不能嵌套。任何元素都不能递归嵌套。锚和字符突出显示可以放在其他构造。标签每个元素以标记开头,每个非空元素以标记结尾带有标签。开始标记由<和>分隔,结束标记为由分隔.姓名元素名称紧跟在标记打开分隔符之后。姓名由一个字母后跟最多33个字母、数字、句点、,或连字符。名称不区分大小写。属性在开始标记中,在元素名和结束分隔符。属性由名称、等号和值。允许在等号。该值在由单引号或用双引号括起来的字符串。(参见:其他可接受形式@@)该字符串像RCDATA一样进行解析(见下文),以确定属性值。例如,这允许在由字符引用表示的属性值。属性值的长度(解析后)限制为1024字符。元件类型标记的名称是指HTML中的元素类型声明DTD。元素类型声明将元素名称与属性及其类型和状态的列表内容类型(EMPTY、CDATA、RCDATA、ELEMENT或MIXED之一)确定元素内容的语法内容模型,指定嵌套元素的模式和数据空元素空元素的声明中包含关键字Empty。对于例子: 伯纳斯-李和康诺利6 这意味着:是合法的,但其他这些不是: 字符数据关键字CDATA表示元素的内容是字符数据。字符数据是直到下一个末尾的所有文本上下文中的标记打开分隔符。例如:指定以下文本是合法的XMP元素:<trans data-src="Here&#39;s an example. ">这里有一个例子。</trans><trans data-src="It looks like it has">看起来好像有</trans><trans data-src="&#60;tags&#62; and &#60;!--">&#60;tags&#62;和&#60;--</trans><trans data-src="comments--&#62;">评论--&#62;</trans><trans data-src="in it, but it does not. ">但它没有。</trans><trans data-src="Even this">即使是这个</trans><trans data-src="&#60;/ is data.">&#60;/是数据。</trans>字符串没有办法代表标签在CDATA中可替换字符数据具有RCDATA内容的元素的行为与具有CDATA的元素非常相似,字符引用和实体引用除外。元素声明如下:内容中可以包含任意字符序列。字符引用表示否则会被识别为标记,使用字符引用。字符串&#表示后跟字母或数字时的字符引用。这个分隔符后跟十进制字符编号和分号。例如:您甚至可以在RCDATA中表示</end>标记Berners-Lee和Connolly 7 实体引用HTML DTD声明小于、大于和的实体与号字符和每个ISO拉丁文1字符,以便你可以用名字而不是数字来引用它们。字符串&表示实体引用,后面跟一个字母或数字。分隔符后跟实体名称和分号。例如:库尔特·哥德尔是一位著名的逻辑学家和数学家。注意:要确保字符串具有没有标记,HTML编写器应该表示所有通过字符或实体引用。元素内容一些元素具有,而不是声明类型的关键字内容,一个内容模型,它告诉数据和允许嵌套元素。如果元素的内容模型不包括符号#PCDATA,内容为元素内容。元素内容中的空白被视为标记并被忽略。任何非标记字符(即数据字符)是非法。例如:声明一个可以如下使用的元素: 头部示例 但以下是非法的:不允许有数据! 两个isindex标记混合内容如果内容模型包含符号#PCDATA元素被解析为混合内容。例如: 这表示PRE元素包含一个或多个A、B、I、U或P元素或数据字符。以下是PRE元素的示例:
名称cat—连接文件夹
示例上述PRE元素的内容为:A B元件字符串“cat--concatenate”A元素字符串“\n”另一个B元素字符串``\n cat。评论之后分隔符,忽略直到下一次出现--为止的所有文本。因此,注释不能嵌套。关闭--和>。(但不是在开幕式之间
HTML指南:推荐用法

还有一些其他的SGML标记构造已弃用或非法。分隔符信号。。。..线路中断如果换行符是元素中的第一条或最后一条内容。这允许您要么写
一些示例文本
一些示例文本
这些将以相同的方式进行处理。此外,不为空但不包含任何内容的行将是完全被忽视。例如,元素
第一条线路第三行第四行
仅包含字符串第一条线路第三条线第四行。空格和制表符空格字符必须呈现为水平空白。HTML,多个空格应按比例放大空格。未定义水平制表符(HT)的呈现,因此,不应使用HT,除非在PRE(或过时的XMP、LISTING或PLAINTEXT)元素。不应使用空格或制表符进行SGML源布局更有吸引力或更容易阅读。标记信号汇总Berners-Lee和Connolly 10 以下分隔符可能表示标记,具体取决于上下文。分隔符信号 Berners-Lee和Connolly伯纳斯-利和康诺利32 Berners-Lee和Connolly伯纳斯-利和康诺利33 Berners-Lee和Connolly伯纳斯-利和康诺利35 ]>伯纳斯-李和康诺利36 链接关系值状态:此列表不是标准的一部分。其目的是说明链接关系的使用并提供框架以进一步发展。此列表的添加将由HTML注册控制权威。在以下条件下,可以使用实验值它们以“X-”开头。超文本链接的REL属性的这些值有一个此处定义的重要性,可以通过以下特殊方式处理HTML应用程序。这些关系涉及整个文档(对象),而不是它们中的特定锚。如果使用关系值通过锚定而不是整个文档之间的链接语义被认为适用于文档。在下面的解释中,A是链接,B是HREF指定的目标文档属性。标记为“非循环”的关系具有无序列的属性与该关系的链接的回到自己身上。因此,这些类型的链接可用于定义树。文档之间的关系这些关系是文档本身之间的关系而不是文件的主题。使用索引B是阅读本文档的用户搜索的相关索引他要求提供索引搜索功能。一个文档可能有任意数量的索引链接,导致以客户端定义的方式搜索索引顶部。B必须支持其访问协议下的SEARCH操作。用途B是一个索引,应用于解决中的词汇表查询文档。(通常,双击锚内)。一个文档可以有任意数量的词汇表链接。公告Berners-Lee和Connolly伯纳斯-利和康诺利37 B中的信息是对A中信息的补充和补充。注释由一个人使用,写下相当于“margin”的内容注释”或其他对他人文档的批评。示例:新闻组与其文章之间的关系。非循环。回复类似于Annotation,但没有迹象表明B是附属于A:A和B的基脚相等。示例:邮件消息与其回复之间的关系新闻文章及其回复。非循环。嵌入如果遵循此链接,则嵌入其末尾的节点到源文档的显示中。非循环。预防措施在作者定义的有序结构中,A在B之前,B是然后是A。非循环。任何文档都只能有此关系的一个链接,和/或反向关系的一个环节。注:可用于控制导航设备,生成打印材料等与“子文档”一起用于定义一个树,例如由超文本文档制成的印刷书籍。文档只能有一个这样的树。子文件B是作者层次结构中与a.非循环的较低部分。请参见也在前面。出席无论何时出现A,都必须出现B。这意味着无论何时检索A,都必须检索B。搜索Berners-Lee和Connolly伯纳斯-利和康诺利38 当遵循链接时,应该搜索节点B,而不是比呈现的要多。也就是说,在客户端软件允许的情况下用户应该立即看到一个搜索面板提示输入文本。然后在没有节点B的中间检索或表示取代B是a的早期版本。非循环。历史B是a的版本列表链接反向链接必须存在于从B到A以及所有其他已知链接之间A的版本。文件主题的关系这些关系传达了由文档,而不是文档本身。包括A包括B,B是A的一部分。例如文件A是文件B所述组的一部分。非循环。制造节点A描述的人员(等)是作者或负责人对于B此信息可用于保护,并通知作者发送邮件给作者等。感兴趣的A描述的人(等)对节点B感兴趣。此信息可用于通知更改。通常,这是一个请求,当对象B在某些方法是,创建一个指向对象a的新链接。短语“对象B变化”可以狭义地解释为“B自身改变”)或广泛(如“B或与之相关的任何想法或与之密切相关的变化”)。所考虑的变化量值得通知的信息也需要解释,从源代码中的位更改到“新版本”语句Berners-Lee和Connolly伯纳斯-利和康诺利39 由出版商提供。注册管理局HTTP注册机构负责维护以下列表:链接和定位元素的关系名称建议互联网指定号码管理局或他们的继任者承担了这一角色。如果未注册的值以“X-”开头。参考文献SGML ISO 8879:1986,信息处理文本和办公系统标准通用标记语言(SGML)。sgmls James Clark的SGML解析器源自ARCSGML由编写的解析器材料查尔斯·戈德法布(Charles F.Goldfarb)。来源可用在目录中的ifi.uio.no FTP服务器上/发布/SGML/SGMLS。WWW全球网络,全球信息主动权。有关引导信息,请访问telnetinfo.cern.ch或查找文档网址://info.cern.ch/pub/www/docURL通用资源定位器。RFCxxx。当前可通过匿名FTP访问/pub/ietf中的info.cern.ch。作者地址这份文件是在许多人的帮助和建议下编写的越过网。Dan Connolly准备了DTD和关于HTML和SGML,同时与Convex Computer Corporation of 3000合作德克萨斯州理查森市Waterview Parkway,邮编75083。他现在在AtriumTechnology Inc.,目前不是该文档的编辑。蒂姆·伯纳斯-李地址CERN1211日内瓦23瑞士电话:+41(22)767 3755传真:+41(22)767 7155电子邮件:timbl@info.cern.ch伯纳斯-李和康诺利40 丹尼尔·康诺利地址:Atrium Technologies,Inc。5000湖畔广场275室德克萨斯州奥斯汀78746美国电子邮件:connolly@atrium.comBerners-Lee和Connolly伯纳斯-利和康诺利41