脱机目录和源

本页面告诉您如何在以下情况下查找和获取古腾堡项目电子书:

新书订阅

RSS(RSS)

在中查找我们的RSS源缓存/提要位置。美国东部时间凌晨2点后每天更新。

电子邮件

张贴“列表是每一本新电子书在上传到古腾堡项目服务器时发布的地方。然后可以下载新书,通常在2小时内。该列表有每日一次的摘要选项,还有在线公共档案。

社会化媒体

社会化媒体

OPDS公司

开放出版发行系统是古腾堡项目用来发现新电子书的一种方法。OPDS主要用于在可以呈现或管理内容列表的应用程序中使用的机器对机器通信。

要使用古腾堡项目的OPDS提要,请从https://www.gutenberg.org/ebooks/search.opds网站/.

古腾堡电子书托管项目网站列表

古腾堡项目收藏可从数十个网站获得,这些网站通过http/https、ftp、rsync和其他一些方法提供访问。请参阅我们的列表镜像站点选择位置、访问方法或速度。镜像通常没有友好的基于Web的前端,但有集合。请参阅镜像操作指南了解详细信息。

电子图书的GUTINDEX列表

至少每月更新一次。这些纯文本文件提供了有关每本电子书的基本信息,非常适合从您自己的系统中进行搜索(例如,在Web浏览器或文字处理器中使用control-F)。它们是古腾堡项目的加入列表。请注意,不建议将这些文件用于自动化(即用作生成计算机化数据库的输入)。相反,请使用下面提到的目录文件之一。

GUTINDEX上市情况(按年份)

如果GUTINDEX。ALL对您来说太大了,或者您更喜欢单独的年度列表,您可以按年下载GUTINDEX文件。

附属网站

不是古腾堡计划的一部分——在访问或重新发布任何电子书之前,请检查所在国家的法律。

目录/文件夹列表

您可以从导航目录/文件夹内容/迪尔斯但这并不是很友好。

机器可读格式的古腾堡项目目录元数据

XML/RDF/CSV

所有古腾堡项目元数据都是数字可用XML/RDF格式。这是每天更新的(除了下面提到的传统格式)。请使用其中一个文件作为数据库或其他可能正在开发的工具的输入,而不是爬行或抢劫网站。

请注意,与每本书.rdf文件。它们位于cache/epub(即cache/generated)目录中,可通过镜像或上述目录/文件夹列表进行访问。大型XML/RDF文件只是所有per-eBook元数据的串联。

古腾堡项目元数据不包括原始打印源发布日期。由于古腾堡计划电子书与源书有很大不同,我们跟踪古腾堡项目的出版日期(“发布日期”),但在元数据中不包括打印源信息。差异几乎总是包括取消排印、删除页眉/页脚、在标记期间更改排版,有时还重新定位图像、脚注、标题等。此外,古腾堡项目电子书有时来自多个印刷版本。

许多电子书都包含标题页或其他页面的扫描,这些页面可能表示原始印刷出版物。如果将古腾堡项目的电子书与特定的印刷版相匹配对你来说很重要,那么这很可能需要通过将印刷源与电子书进行直接比较来完成。

还提供了与Excel兼容的电子图书元数据CSV电子表格在这里。此文件每周更新一次。

MARC记录(机器可读目录):不再可用

古腾堡项目以MARC格式分发了目录,然后在服务器升级导致我们的软件无法运行时停止了。此外,一名志愿者准备的遗产项目,pgrdf2标记.pl,使用了以前版本的XML/RDF数据,但不使用当前版本。

您自己的计算机或移动设备上的本地可浏览副本

新西兰是一个允许您下载大型收藏并在本地使用的应用程序。古腾堡项目的内容副本于2018年11月提供,可能会定期更新。