HTML常见问题解答(旧版)

本页部分或全部过时:请参阅帮助部分新上传的生产要求见上传.pglaf.org.

这些指南可能并不反映所有当前的“最佳实践”。请访问分布式校对器查看积极讨论和维护最佳实践的论坛。此外,您还可以查看古腾堡计划的最新电子书,例如。

我可以提交文本的HTML版本吗?

对。

为什么要制作HTML版本?

好吧,你可以只是因为你想做,但在一些文本中有特殊的理由。

如果您想保留文本附带的图片,制作HTML版本意味着您可以指定这些图像出现的位置和方式。

如果文本布局中有特定的有意义的信息无法用ASCII表示,例如特殊字符或复杂的表格或字体,HTML可能会提供一种开放格式的替代方案。

我可以提交没有纯ASCII版本的HTML版本吗?

你可以提交它,但发布团队会考虑我们是否也应该制作ASCII,或者ISO-8859或Unicode版本。我们真的希望我们的文本在任何情况下都能被每个人看到,并且我们不想开始发布任何人都无法访问的文本。

另见常见问题[G.17]“为什么PG要使用Plain Vanilla ASCII?”

HTML文本的PG规则是什么?

1.唯一的绝对规则是,根据W3C HTML标准之一,HTML应该有效,如果使用CSS,则CSS也必须有效。

您可以在W3C的HTML验证器上验证HTML是否有效http://validator.w3.org/

您可以在W3C的CSS验证器上验证您的CSS是否有效http://jigsaw.w3.org/css-validator(验证程序)/

为了更方便、更友好(尽管不太官方)地检查HTML的正确性,您应该使用Dave Raggett的Tidy程序http://tidy.sourceforge.net,它不仅指出了HTML代码中的任何乱七八糟的地方,还提供了一些整洁的模式来清理代码并标准化格式。

之后,我们有一些要求和建议。如果有充分的理由在这种情况下例外,则可以放弃遵守要求。

2.要求:文件名和扩展名

所有文件(以及子目录,如果存在)的名称和扩展名都应全部小写,并且只应使用字母“a”到“z”、数字“0”到“9”、短划线“-”、下划线“_”和句点“.”,每个文件名中只应使用一次,表示扩展名,如image.jpg。是的,我们知道这并不是绝对必要的,但我们不想纠正HTML中引用的“image.png”文件以及文件image中的每个文件。巴布亚新几内亚。这适用于从主HTML文件链接的所有文件,无论是子目录、图像、其他HTML文件还是CSS。

所有图像(如果存在)必须位于名为/images的子目录中。

虽然8.3不是文件名的要求,但文件名应保持合理的简短,并且永远不要超过32个字符。

3.要求:无障碍

在使用样式的地方,无论是CSS还是HTML,都不能强加个人偏好,这可能会影响某些读者阅读或欣赏文本的能力。这是一个指导原则。

W3C可访问性指南http://www.w3.org/TR/WCAG10/full-checklist.html提供了一般网页的清单,这在一定程度上适用于这里&熟悉它们的指南当然是一个好主意。然而,我们在制作电子书时遇到了一个特殊情况:虽然W3C提出了某些内容建议,但我们无法控制内容本身;虽然W3C建议使用最新技术,但这在我们的上下文中毫无意义,因为文本可能会在几十年内保持不变;当W3C谈论一般的网站时,我们正在制作一种特定类型的HTML页面。

列出所有可能的暗示并不实际,但具体来说,您应该尝试:

  1. 确保您的文本布局合理,在所有字体大小下都是可读的。
  2. 如果使用CSS,请确保即使删除了CSS,HTML也是可读的。
  3. 确保图像具有有意义的“alt”属性,以便那些看不到图像的人可以看到图像的描述,并且表具有“summary”属性。您应该避免:
  4. 强制以磅为单位的绝对字体大小;相反,您可以使用“em”或“%”来表示CSS中较大或较小的文本,或者在HTML字体标记中使用“”、“”或“-1”、“+1”。
  5. 强制使用绝对字体或字体系列或通用字体系列。
  6. 强制使用白色以外的背景色或黑色以外的文本颜色。
  7. 使用框架、闪烁文本、弹出窗口、自动重新定向或自动重新刷新。
  8. 使用表而不是表格数据。许多商业网页的整个布局都使用表格,但我们应该只在显示实际信息表格的地方使用表格。
  9. 创建一个指向电子书外部任何内容的超链接,除了链接到电子书图像或文本提供商网站的Credits Line中。

一如既往,尽管有一般规则,但在有些情况下,在文本的一小部分中,这些限制不应适用。例如,在呈现字母时,可以使用通用字体系列“草书”,或者为小插页或标题使用不同的颜色。

4.要求:无脚本

我们不希望我们的读者担心恶意代码或简单的错误代码,所以我们不会在HTML文件中发布任何形式的脚本,包括Javascript。

5.要求:HTML和纯文本

古腾堡项目确实发布了格式良好、符合标准的HTML。然而,我们坚持要为我们发布的所有HTML文档提供纯文本版本(即使没有图像或格式),除非ASCII完全不能合理使用,例如用于阿拉伯语或数学文本。

6.要求:过账存档格式

如果HTML书包含多个文件(包括图像),请创建一个包含书中所有文件的ZIP(首选)或TAR存档以进行上传。

7.建议:简单

使HTML尽可能简单。HTML是一个不断发展的标准,从长远来看可能会完全过时。使用高级功能可能意味着您的版本将过时或无法阅读,速度会快得多。

8.推荐:图片

HTML中包含的图像应采用Web浏览器或阅读器可以读取的格式:GIF、JPEG或PNG。图像应编辑为高质量的合理小文件大小。就图像大小和文本中的位置做出最佳决定。包含的每个图像都必须链接到HTML(由HTML引用)。

作为HTML电子书一部分显示的图像通常不应大于200000字节(200kb),除非电子书侧重于插图。例如,章节开头的花哨字母图像或线条图的大小可能为20-60kb。彩板可能需要200kb或更多。

当需要更大的图像文件以获得更高的分辨率时,可以从低分辨率图像链接这些文件。想象一下,一个显示在HTML中的色板,大小为150kb。单击该图像可以转到更高分辨率的图像,甚至可以达到数兆字节(1000000字节)。这是一种很好的方式,可以让人们在线阅读电子书,从而获得良好的阅读体验,而无需大量下载。这些点击式图像可能对大多数阅读器设备(可能查看epub或mobi格式)都没有用处。可能会添加一个“抄写者注释”来描述为什么会有更大版本的图像,以便阅读电子书的人可以决定是否查看它们。

9.建议:线路长度

如果这样做是合理的,请尝试将文本段落环绕在正常的70个字符的PG边距周围。理想情况下,除了HTML标记和实体外,HTML应该尽可能与文本版本相同。打开HTML的人不会都使用浏览器,他们需要进行更正,不是所有的编辑器都可以处理很长的行,即使使用可以处理长行的编辑器,也更容易处理短行。此外,非常希望您的文本和HTML文件尽可能逐行匹配,以便于维护——重写HTML只会使比较和修复变得更加困难。

10.建议:单文件HTML

通常,这本书的所有HTML和CSS都应该在一个文件中提供,所有图像都是/images子目录中的单独文件。有时可能适合将HTML拆分为多个文件,例如,当它太大而无法容纳在标准浏览器中时,在这种情况下,也可以将CSS作为与每个HTML文件链接的单独文件提供。

如果必须将一本HTML电子书拆分为多个文件,则上述第2点中列出的文件命名要求适用。

我可以在HTML中使用Javascript或其他脚本语言吗?

不。

我们不希望读者担心任何潜在的恶意代码或普通错误代码。

我应该将HTML版本全部放在一个页面上,还是将其拆分为多个链接页面?

对于典型的小说来说,一个页面或HTML文件是合适的,但当单个HTML文件的大小达到约2 MB时,可能值得考虑拆分,因为在某些浏览器中加载它很困难。

在其他一些情况下,如果内容需要不同页面上的不同样式,或者不同页面需要不同的字符集,或者带有图像的页面太重,则可能需要拆分HTML,即使HTML本身从技术上来说不太大。

如何检查我在HTML编码时是否没有犯错误?

在编写HTML时,您可能会犯两种错误:一种是生成无效的HTML,另一种是产生不符合您要求的HTML。

检查无效HTML很简单。W3C站点<http://validator.w3.org>将正式验证您的文件并指出任何错误,这是官方标准。然而,它并不总是很方便使用,尤其是当您处于修复和重新测试的循环中时。为此,你应该试试Tidy程序<(http://tidy.sourceforge.net)[http://tidy.sourceforge.net]>,它在您的计算机上运行,告诉您错误,并具有其他有用的功能。几乎每个操作系统都可以使用Tidy,并且有几个Windows实用程序包括Tidy。Tidy主页上的链接将引导您找到合适的版本。与网上验证相比,Tidy既快捷又友好,但它并不是最后一句话。W3C验证程序可能会发现形式错误,例如DOCTYPE与HTML标记或标题不匹配,而Tidy可能不会。最好的解决方案是使用Tidy完成HTML测试,然后,当Tidy发现没有什么可抱怨的地方时,将其提交给<http://validator.w3.org>以获得批准的公章。请在提交HTML之前运行这些检查;我们通常可以为您修复它,但这可能需要我们做很多工作。

生成真正满足您需要的HTML也同样重要。如果您从文本转换了电子书,可能会造成不一致,或者在错误的位置关闭了斜体标记,或者在某些时候使用了错误的标记。检查这一点的唯一方法是在浏览器中阅读HTML。

我可以提交其他人文本的HTML或其他格式吗?

也许 吧。

这个问题有几个复杂之处。首先,您必须理解,您的HTML文件很可能最终会被更好的信息覆盖。

与纯文本文件相比,HTML文件的价值在于它能够捕获纯文本中丢失的原始元素。纯文本文件,使用扩展字符集,如ISO-8859[V.76]或Unicode[V.77]和下划线对于斜体字,可以在几乎所有情况下捕获作者的所有意图。有时,原始文件的图像和其他重要功能不能单独以纯文本捕获,而是可以以HTML或其他标记捕获。

2001年9月,当迈克尔·哈特(Michael Hart)停止发布图书时,我们所有电子书的HTML格式约占1.6%。2002年底,这一数字已上升到我们所有电子书的近11%。到2004年春季,它已经进一步上升到我们所有电子书的28%左右。如果您有一本现有已发布书籍的清晰副本,并且原始纯文本中没有包含其他功能,我们鼓励您制作新版本、版本或格式,更正原始版本中的任何错误,并添加未包含的任何新信息。

另一方面,如果你只是想进行“盲格式转换”——根据原始制作人的工作,最好猜测一本你从未见过的书的HTML或其他格式、版式应该是什么——你最好的选择是与原始制作人联系,并询问他们是否能为你提供更多的工作材料。否则,你充其量只是重新安排信息,而不是贡献新的东西。

盲格式转换可以在2分钟[R.33]到1小时的任何时间内完成。当这些文件没有新内容时,尤其是当两个人可能想要转换相同的文本时,我们继续发布这些文件是没有意义的。很可能,在未来几年的某个时候,我们将开始一个大规模的转换项目,在所有现有的文本文件中添加某种形式的标记,以便于服务,而在这一点上处理现有标记样式的混搭也无济于事。

HTML文件中的图像可以有多大?

图像应该尽可能大,不要太大。

对不起,这里没有明确的号码。网页设计者为了在一个页面上节省额外的20K而拼命工作;你也应该这样。如果你是一个有经验的HTML制作者,你会知道这些东西;如果不是这样,请将其作为一个指导原则,即您通常应该将图像的大小保持在40K到60K的范围内,偶尔会涉足80-100K的领域。除非你是在复制精美的艺术品,否则它通常足够大,可以拍摄出清晰的图片。

我扫描的图像太大,无法包含在HTML中。我该怎么办?

s是一个常见的问题,书中的图像占据了一整页或半页。您的图像应该具有合适的下载大小,每个图像的2 MB高质量扫描对于大多数PG文本来说并不合适!

为了简单的查看目的,您应该减小原始扫描的大小,甚至质量。有很多图像处理软件可以做到这一点。对于Windows,您可以查看免费软件Irfanview,对于*nix和Windows,都有ImageMagick[P.1]。在“帮助”中查找单词“调整大小”和“重新采样”。

除了简单的转换器外,您还可以在完整的图像创建和编辑软件包(如Paint Shop Pro、Adobe Photoshop和the Gimp[P.1])中操作图像。

不同的图像编码方法会对文件大小产生巨大影响。上面提到的任何软件包都可以将图像编码为GIF、JPEG或PNG,尤其是对于黑白线条图,这些软件包可以编码为非常不同的大小。因此,例如,60K JPEG可以保存为30K GIF,因为GIF编码对特定图像更有效。试试你的图片,看看有什么效果。

通常,在2004年,图像最好保存为JPEG(.jpg)或PNG(.PNG)。任何作为GIF工作得很好的东西都可能会和PNG工作得一样好,或者更好,所以主要的选择是在PNG和JPEG之间。

JPEG倾向于更好地解决类似照片的图像问题,即考虑到图像质量与文件大小,使用阴影(即非纯白色或纯黑色)背景,而PNG更适合在白色背景上绘制清晰的黑色线条。原因是JPEG的“有损压缩”可以通过删除阴影中的单个小黑白像素来节省大量文件大小,人眼不会特别注意到这一点,就像大多数人的耳朵不会注意到数字记录中丢失的频率一样。

如果您的图像完全适合JPEG处理,那么很可能可以以大约50K的文件大小获得非常好的.jpg文件。

由于大多数人都会在分辨率低于或大约1000像素宽的屏幕上通过浏览器查看这些图像,所以您应该将图像宽度控制在600像素以内。如果你有一张2000或3000像素宽的原始扫描图像,你需要调整它的大小。

操作图像时,请始终使用原始图像。不要把你的原稿转换成JPEG格式,然后缩小它,把它转换成PNG格式。根据格式的不同,图像在转换时可能会失去清晰度(在您最喜欢的搜索引擎中搜索“有损压缩”以了解更多信息),并且它们在调整大小时肯定会失去清晰度,最终会产生“…的不完美副本的不完美复制”的效果。当您进行实验时,获取原始文件,调整大小并另存为PNG,然后返回原始文件,重新调整大小并保存为JPG,依此类推。

您也可以使用图像优化器。这些是专门的软件程序,它们试图在不牺牲分辨率或细节的情况下缩小图像文件。

我可以包括我制作或发现的装饰图像吗?

不。

请仅包括您从书中获得的图像。如果你想为自己的网站制作一本书的版本,你当然可以在那里使用你喜欢的任何东西,但出于PG的目的,我们想要这本书,整本书,除了这本书什么都不要。

如何从HTML文件创建纯文本版本?

当然,您可以手动编辑HTML,但有几种更简单的转换方法。

您可以在浏览器中查看HTML,选择所有文本,然后只需复制并粘贴到编辑器中。这是最简单的,但不能很好地处理表格格式。

您可以使用Lynx[P.1]浏览器使用命令转换文本

lynx-转储myfile.html>myfile.txt

Bruce Guthrie的MS-DOS HTMSTRIP[P.1]非常可配置。<http://www.w3.org/Tools/html2things.html>包含其他HTML到纯文本转换器的列表。

如何从纯文本文件创建HTML版本?

这不是一门HTML课程,但对于大多数书籍来说,您并不需要真正的HTML课程。一旦你掌握了基本的HTML,为大多数书籍制作一个HTML格式是非常容易的,而且不会花很长时间。假设您已经准备好了完整的PG纯文本文件,并逐步完成制作HTML版本所需的步骤。我们将通过逐次逼近来实现这一点,首先处理主要的事情,然后越来越多地处理细节。

有很多专门的HTML编辑器,但实际上并不需要它们。您用来创建文本的编辑器也会创建HTML。HTML只是文本,添加了两种类型的特殊指令:标记和实体。

标记是对浏览器的指示,通常用于显示具有特定规则的内容。标签显示在尖括号内:例如,

是开始新段落的指令。实体是一个命名的特殊字符,可能在角色集中不可用。实体以“&”开头,以分号“;”结尾:例如,-表示em-dash。在写这些步骤时,我正在标记一段虚构的简短文本,大致基于问题[V.121]中的示例页面。您可以通过查看文件来查看每个阶段所做的更改

  查看源代码 (开始前的文本)
htmstep1.htm 查看源代码 (添加HTML页眉和页脚后)
htmstep2.htm 查看源代码 (添加段落标记后)
htmstep3.htm 查看源代码 (在标记主要标题之后)
htmstep4.htm 查看源代码 (添加特殊换行符和缩进后)
htmstep5.htm 查看源代码 (添加斜体和粗体后)
htmstep6.htm 查看源代码 (添加重音符号和非ASCII字符后)
htmstep7.htm 查看源代码 (添加图像后)
网址:htmstep8.htm 查看源代码 (展示一些额外的技巧)

开始之前,请确保您可以在浏览器和编辑器中看到这些文件。在编辑器中,您应该可以看到HTML代码;在浏览器中,您应该按照预期的方式查看文本。

请注意,对于已经了解HTML的人来说:是的,这个示例省略了许多可能的方法和许多改进。你已经知道如何做你想做的事了-跳过,给初学者安静学习的空间!:-)

在文本文件顶部添加以下行:

<DOCTYPE HTML PUBLIC“-//W3C//DTD HTML 4.01过渡//EN”><html><头部><meta http-equiv=“Content-Type”Content=“text/html;charset=ISO-8859-1”><title>The Project Gutenberg eBook of My Book,作者:A.N.Author</头><body>

让我们逐一解释一下:

<!DOCTYPE HTML PUBLIC“-//W3C//DTD HTML 4.01过渡//EN”>

表示您的文件是HTML 4.01 Transitional,这是最新版本,允许使用最广泛的标记和实体。

<html>

表示HTML的开始<pre<head></pre>表示HTML标头信息的开始。<pre<meta http-equiv=“Content-Type”Content=“text/html;charset=ISO-8859-1“></pre>表示字符是文本,使用ISO-8859-1编码。如果需要使用不同的字符集,则应将ISO-8859-1更改为您想要使用的任何字符集。ISO-8859-1适用于许多使用法语或德语单词的英语PG书籍。

<title>The Project Gutenberg eBook of My Book,作者:A.N.Author

显然,您应该将其更改为您正在制作的实际标题和作者。这个

</头>

表示HTML标题信息的末尾

<body>

表示实际文本本身的开始,即书的正文。

在文件的末尾,应该附加这两行

<body></html>

这些表示书籍正文的末尾和HTML的末尾。

此时,您实际上有一个有效的HTML文件!好的,如果你用浏览器查看它,它看起来不像它应该的样子,但它是HTML。将其保存为MYFILE1.HTM或STEP1.HTM之类的名称,然后从以下位置获取适用于DOS、Unix、Mac或Windows系统的Tidy副本http://tidy.sourceforge.net。在文件上运行Tidy,告诉它只是查找错误(如果从命令行运行,则使用Tidy-e;如果使用的是GUI版本,则应该有一个菜单选项或勾选框,仅用于显示错误)。整洁应该告诉你没有错误。耶!

如果它确实表示存在错误,请在继续之前立即处理它们。确保在每一步都清除了所有错误;现在比以后容易多了。此外,当您完成每一步后,在文件名中保存一个数字,这样,如果您以后遇到问题并感到困惑,最坏的情况是,您可以在上一步结束时返回到正确的版本。

此时最可能出现的错误与字符“<”、“>”或“&”有关。这些是HTML用来指示标记和实体的字符。如果在文件的文本中使用了这些字符(可能是与号),则应将其替换为实体,以便HTML知道它们将显示为字符,而不是解释为命令。

更换

&带有&<与<>使用>

文件htmstep1.htm中有一个这样的示例

第2步。添加段落标记。

对于小说和普通散文来说,段落是主要的逻辑和表现单位。段落在HTML中以<p>开头标记,</p>结尾标记。你实际上不需要在末尾添加</p>,但添加这些是一个很好的习惯。你一开始就非常需要<p>。

a对中的线长无关;查看文本的浏览器将忽略额外的空格和行号,并将根据屏幕大小对文本进行换行。这对诗歌和餐桌不好,但我们稍后会讨论。对于这一步,您需要知道的是,您可以保持文本原样,只需添加段落标记。

在每一段的第一个字母之前的行首加上一个<p>,在每一段落的最后一个字母或标点符号之后加上</p>。如果你能在编辑器中做宏,这只需要一分钟;否则,它可能会很无聊,但至少它很简单。在这一步中,将段落标记放在后面有空行的所有内容周围,甚至包括诗歌或章节标题。我们稍后会回来更改。

现在将文本保存为MYFILE2.HTM或STEP2.HTM。再次运行Tidy以检查错误,并在继续之前修复它们。

如果您现在在浏览器中查看文件htmstep2.htm,您将看到它开始成形。在编辑器中查看它,您将看到段落标记。

步骤3。为标题添加标记。

我们想向读者指出,某些行用于章节或其他标题。HTML为此提供了<h1>、<h2>等标签<h1>表示最大的标题,通常,您会将其保留为标题,并将<h2>用于章节标题。如果你觉得这些太大,你可以选择<h2>作为主要标题,<h3>作为章节。无论何时使用其中一个标头标记,都必须使用其等效的结束标记将其关闭。因此,章节标题可能如下所示:

<h2>第十一章</h2>

由于不会有很多标题,而且大多数标题只在一行上,所以这通常并不难。请查看文件htmstep3.htm以了解我们的示例是如何改进的,如果您与我一起工作,请不要忘记用新名称保存文件并进行检查。

在我们的示例中,我们已经用段落标记了一些行,现在我们想在其中放置标题,因此我们将更改这些<p>s,<h2>s,因为我们不需要或不想将一行标记为两者。

步骤4。排列诗句、目录和其他列表。

HTML标记<br>告诉浏览器在不开始新段落的情况下强制换行。当我们不想把文本全部包装在一起,但也不想用空行隔开时,比如在诗歌和目录中,我们就使用这种方法。

在我们的示例中,我们将<br>标记添加到目录中每行的末尾和诗句的每行末尾。如果我们正在写一整本诗集,同样的原则也适用,但我们会更多地使用<br>标签。

如果我们想缩进一行诗,我们可以在行首使用。通常,无论单词之间留有多少空格,HTML都会将它们压缩为一个空格,因此普通的缩进是不起作用的。但“非中断空格”实体将导致浏览器为每个字符显示一个空格。这样,您就可以根据需要缩进任意多个字符。

文件htmstep4.htm显示了效果:这是一个完全可读的HTML文本!

步骤5。再加上斜体和粗体。

HTML标记<i>告诉浏览器开始显示斜体,</i>告诉它停止。类似地,<b>标记告诉它显示粗体,</b>标记粗体文本的结尾。有关更改,请参见htmstep5.htm。

步骤6。恢复口音和特殊字符。

因为我们在一开始就声明了HTML文件使用ISO-8859-1,所以我们可以为西欧语言使用任何常见的重音字符,但我们也可以使用HTML实体。例如,对于“flaneur”中的“a surpiflex”,我们可以直接使用ISO-8859字符,也可以使用HTML实体名称–或数字–。

字符和实体之间存在权衡:实体不限制您使用任何特定的字符集,但在查看HTML源代码时,字符是直接可读的。

在授权中,实体名称和数字之间也存在权衡:旧的浏览器可能无法识别某些实体名称,但实体确实使文本在多个字符集中工作。你选择哪一个完全取决于你,但最好保持一致;如果您喜欢实体,请在任何地方使用它们。实体可以用它们的名称表示,例如,-,也可以用它们从ISO-10646(请参阅Unicode)编号派生的编号表示,例如-。

您可以选择其他特殊字符实体来替换主文本中的ASCII等效字符。以下是一些常见的问题:

我们已经看到了

&&ampersand替换“&”<<小于替换“<”>>大于替换“>”空格在您想要缩进时替换空格

这些对许多PG文本也非常有用:

--em-dash替换“--”°°degree替换“deg.”或“degrees”££英镑代替“L”或“L”或“磅”

还有很多其他的<https://www.w3.org/TR/html4/sgml/entities.html>有一个更完整的列表。请注意,您不必在HTML中使用这些实体;如果你对阅读“500磅”的文字感到满意,那就没有必要赚500英镑。

我在htmstep6.htm中做了一些实体更改。

首先,你需要准备好你的图像。您应该已经将图像的大小调整为希望查看的大小。您还应该将其保存为GIF、JPG或PNG图像,因为这些是当前浏览器最支持的格式。

如果你的图片名为front.gif,并且是书的正面图片,你应该加上这行

<img src=“front.gif”alt=“Frontispiece”>

在您希望显示HTML的位置。

“alt”文本为图像提供标签,如果无法显示图像,或在为视力受损人士提供浏览器的情况下,将显示该文本。

除非你愿意,否则你不必在HTML文件中添加图像。在许多旧书中,根本没有图像可以添加。

我最后的HTML文本现在位于htmstep7.htm中。您需要将图像front.gif放在同一个目录中才能看到它。当您发布HTML文本时,图像将与之一起压缩,以便将来的读者可以看到它们。

第8步。交给你!

这足以为大多数PG文本创建一种合理的HTML格式,但它并没有涵盖HTML中可以完成的所有操作。如果您已经了解了这一点,我推荐W3C的教程:<http://www.w3.org/MarkUp/Guide网站/><http://www.w3.org/MarkUp/Guide/Advanced.html> 它覆盖了我们刚刚穿过的地面,并且走得更远。

这里还有一些你可能想知道的事情,但不要因为可以就疯狂地添加标签!只有在你真正需要的时候才使用它们。文件htmstep8.htm显示了其中的一些技术。就个人而言,我认为这有点过头了,我更喜欢htmstep7的效果,使用左对齐的章节标题,但这是一个品味问题。

一旦你习惯了大多数PG电子书所需的基本HTML,你可能会在一个小时内转换一个。

如何在特定段落之间增加间距?

使用额外的<br>标签。

如何使文本、图像或标题居中?

将<center>和</center>标签放在您想要居中的位置,例如:<center><h2>第12章</h2>

我如何布置表格信息?

最简单的方法是使用<pre>和</pre>标记。这将导致它们中的任何内容都显示为纯文本,就像在原始版本中一样,这样就可以像在文本版本中一样用空格分隔条目。你也可以用它写诗,虽然你通常不需要。这并不完全令人满意,但它会奏效。

制作一个完整的HTML表格需要使用<table>、<tr>(表格行)和<td>(表格详细信息)标记等,表格的完整说明超出了本常见问题解答的范围。

简单地说,您可以用<table>标记开始一个表。

<表格></表格>

对于表中所需的每一行,打开和关闭一个表行<tr>标记,如:

<表格><tr></tr><tr></tr></表格>

然后,对于行中的每个单元格,指定<td>标记和该单元格的内容:

<表格><tr><td>这是左上角的单元格</td><td>这是右上角的单元格</td></tr><tr><td>这是左下角的单元格</td><td>这是右下角的单元格</td></tr></表格>

这只会划伤桌子的表面。然而,网络上有很多指南,一旦你知道要查找哪些标签,就很容易找到。W3C在HTML 4.01规范中提供了表格的简要讨论,网址为<https://www.w3.org/TR/html4/struct/tables.html#h-11.5>他在<https://www.w3.org/MarkUp/Guide/Advanced.html>还显示了如何制作HTML表。

第9步。一些常见问题

当你刚刚开始编写HTML代码时,似乎错误从各个方面都在向你袭来。潮水可能会涌出一连串你不认识或不理解的抱怨。如果有什么安慰的话,这是正常的!

只需将错误列表从顶部开始,一次一行。通常,一个实际的错误,比如没有关闭标记,可能会导致很多错误,因为未关闭的标记可能会导致许多后续标记被报告为错误。

常见错误包括:

  1. 标签中的简单输入错误,如<h2Chapter 3(第三章)而不是<h2>第三章</h2>
  2. 未闭合标记,例如忘记在上面的示例中添加</h2>,或者忘记在结束标记中使用斜线,以便键入<i>斜体<i>而不是<i>倾斜</i>。
  3. 未正确嵌套标记。习惯于将标签视为括号;第一个打开的应该是最后一个关闭的。例如,您应该键入:
这是中心</p> </中心>

而不是

<p><center>这是居中的</中心></p>

制作HTML版本的一个选项是使用GutenMark<http://www.sandroid.org/GutenMark网站/>直接从文本创建基本HTML,然后编辑生成的HTML以添加所需的功能。如果你的主转换有很多问题,这值得一试。