公共领域电子书提交方法

另请参阅藏品开发第页。

古腾堡计划电子书由志愿者创作。本指南包含了创建提交给古腾堡项目的电子书的一些基础知识。

古腾堡计划可以提交哪些类型的电子书?

古腾堡计划只接受美国公共领域的作品。一般来说,向古腾堡计划提交的新文件是印刷书籍的数字化版本,其中大多数至少在95年前出版(有关详细信息,请参阅版权指南)。公共域状态的确认通过copy.pglaf.org网站现场。

馆藏开发侧重于对读者具有持久价值的文学和其他书面作品。由不同兴趣的志愿者进行选择,基本上欢迎所有符合条件的提交。

古腾堡计划并没有回避困难或不受欢迎的话题,也没有回避社会观点或最新知识与当代文学大不相同的话题。

古腾堡项目不接受受版权保护或其他当代项目,即使会授予版权或许可(包括各种“开放”许可)。相反,请参阅如何提交自己的工作在过去,古腾堡项目增加了更多种类的非公共领域和非文学作品,包括版权和其他捐赠作品、非印刷格式以及不同的编码和文件类型。今天,有许多其他项目的渠道,古腾堡项目完全专注于公共领域的工作。这包括文学、参考书和变体,如儿童书籍和游记。

谁应该提交电子书?

创建一本电子书需要做很多工作,古腾堡项目的要求相当严格。如果这些步骤看起来令人生畏,那么您最好与分布式校对器每一位志愿者都贡献了一部分的努力。分布式校对器有自己的提交材料准则以及其他政策、指导和社区。

作为一名“独奏”制作人,需要获得版权,然后扫描或采集以获取书籍页面的图像,然后进行数小时的校对和格式化,最后,确保电子书是完全有效的HTML,拼写正确,并且在其他方面符合古腾堡项目的要求。详细要求见提交页面,其中还包括用于自动检查合规性的工具。任何新的提交者都被邀请在开始之前与我们联系。联系“版权”或“粉刷”团队&emdash;电子邮件地址位于版权上传网站。

提交电子书的第一步是确认古腾堡项目可以合法发行电子书。访问我们的版权所有How-To了解详细信息。古腾堡计划在未确认版权状态的情况下不会接受任何电子书。一般来说,这意味着印刷书籍已经进入美国公共领域,通常是因为版权已经过期。

文件格式

几乎所有新的古腾堡项目电子书的主格式都是HTML。古腾堡项目坚持认为HTML是完全有效的,HTML中的任何级联样式表(CSS)都是万维网联盟(W3C)发布的标准的一部分。

只要可能,古腾堡计划还需要纯文本版本的电子书。我们强调包含纯文本是因为它的使用寿命很长:古腾堡项目包含了许多超过30年的文本文件。在那个时候,数十种广泛使用的文件格式来来往往。所有计算机都可以访问文本,这也是防止未来过时的保险。

古腾堡计划分发没有纯文本版本的电子书的唯一时间是纯文本是不可能或不切实际的——例如,对于我们的电影和MP3音频文件,以及我们的一些数学作品。

如果您从HTML开始,并使用W3C的在线验证器(请参阅上传页面详细信息)。现代电子书生产商几乎总是从(有效的)HTML开始,然后从HTML派生纯文本。然后将这两种“主”格式(文本和HTML)提交给古腾堡项目。然后,自动化工具创建派生格式,包括epub和mobi(通用电子阅读器格式)。

目前不接受手工制作的epub和mobi文件。此限制主要是为了在应用修复程序时易于编辑,因为在每本电子书的生命周期中,修复程序的应用会发生多次。古腾堡项目试图限制主格式的数量,然后自动化派生格式,以促进集合中项目的持续改进。

少数新的电子书使用LaTeX或TEI作为主格式,大多数都包含大量数学符号。其他使用频率较低的格式包括ReSstructured Text(RST)、Rich Data Format(RDF)和其他一些格式。请注意,PDF、Word和其他文字处理程序格式不能用作主格式,因为它们不容易转换为有效的HTML。此外,它们比HTML和纯文本更难修复/更新。

创建电子书

这个志愿者常见问题对古腾堡项目电子书的最佳实践有广泛的指导。这些信息中的一些已经过时了,重点放在了单独的电子书制作人身上。如果您需要其他指导,请联系。

把一本实体书变成一本电子书是保存这本书并使其更广泛可用的一种好方法。从历史上看,电子书的创建通常是由一个人在实体书中一次键入一页。当然,这种方法仍然有效,有时是必要的(例如,如果书损坏或极其脆弱)。