《古腾堡计划的历史与哲学》,迈克尔·哈特著

©1992年8月

开始

古腾堡计划始于1971年,当时迈克尔·哈特被授予操作员的帐户中有100000000美元的计算机时间材料研究部施乐Sigma V大型机操作员伊利诺伊大学实验室。

这完全是偶然的,因为结果是四分之二操作人员碰巧是迈克尔最好的朋友,也是最好的他兄弟的朋友。迈克尔只是碰巧“来对地方了”“在正确的时间”,当时的计算机时间比人们知道该怎么做,并且鼓励这些操作员去做他们希望在“业余时间”用这笔财富做任何事他们会因为工作熟练而学到更多。

无论如何,迈克尔觉得自己无能为力“正常计算”,这将回报计算机的巨大价值他有时间……所以他必须创造价值1亿美元的以其他方式评估。一小时47分钟后,他宣布计算机创造的最大价值不是计算,而是存储、检索和搜索存储的内容在我们的图书馆里。

然后,他开始输入“独立宣言”试图将其发送给网络上的每个人……这只能是今天被描述为创建早期版本的一次不那么侥幸的失误后来被称为“互联网病毒”

对此,经过友好劝阻,第一次发布了电子文本文件,古腾堡计划以迈克尔的名字诞生他说他“赚”了100000000美元,因为《独立宣言》最终将成为一个电子装置在100000000计算机用户的计算机库中未来。

古腾堡哲学的开端

基于迈克尔·哈特的古腾堡项目的前提是:任何可以输入计算机的东西都可以复制无限期……迈克尔称之为“复制技术”复制器技术的概念很简单;一本书或任何其他项目(包括图片、声音,甚至三维项目都可以存储在计算机),则任何数量的副本都可以可用。世界上的每个人,甚至不是这个世界上的任何人(给定卫星传输)可以有一本已经输入到计算机中。

这个哲学前提创造了几个分支:电子古腾堡项目创建的文本(Etexts)将可用以最简单、最容易使用的可用表单。

不处理使其不那么容易获得的建议轻轻地。因此,Gutenberg Etexts项目在所谓的“普通香草ASCII”意味着美国信息交换标准代码:即你在普通打印页上读到的那种字符-斜体,下划线和粗体已大写。

原因是99%的硬件和软件很可能会遇到无法读取和搜索这些文件的情况。

任何其他的文本存储系统都将无法满足99%的观众。

这并不意味着没有其他有效的方法来做etext商业……毕竟,超过一半的计算机是DOS,所以人们可以只需执行DOS即可向广大观众发表演讲。普通香草ASCII码,然而,一路用苹果和Ataris向观众致辞旧的自制Z80电脑,而Mac、UNIX和仍包括大型机。

同样,古腾堡计划选择了一些目标“物美价廉”的哲学……我们选择我们希望的未来很大一部分观众会想要并使用经常。我们经常被要求准备绝版的文本深奥材料的版本,但这并没有规定我们的目标受众,99%的公众。

同样,古腾堡项目也避免了请求,以及创建“权威版本”的压力为关心莎士比亚作品中某个短语的读者写作在其子句之间有一个“:”或“;”。我们的目标是发布在普通人眼中99.9%准确率的文本阅读器。鉴于校对者的偏好据报道,我们缺乏公众目前所具备的阅读能力可能会大大超过这些要求。然而,对于想要“权威版”的人,我们必须等待一段时间,直到这变得更加可行。然而,我们确实如此,打算发行莎士比亚和其他经典作品的多个版本对于学术层面的比较研究2001年,我们计划完成10000本书的项目古腾堡电子公共图书馆。

古腾堡计划是第100届奥运会庆祝活动的一部分公共图书馆周年纪念,始于1995年。古登堡计划希望在第100届1997年美国版权注册周年纪念。

我们希望你也能参与其中。你们都被邀请了。

脚注:

我们的最终目标是提供一个简短的公共领域Etext版本时间。当然,之前的时期进入公共领域的受版权保护的作品从28年(可延长28年)至50年作者的生活,所以这给我们的计划。(原始版权在美国为14年)因此人们最初可以合理预测版权属于公共领域,但可以使用,根据根据新法律,无法预测版权的期限,以及新书进入公共领域的可能性普通读者的寿命是最短的。(假设你可能25岁当你读一本新书,而作者50岁时:平均等25岁作者死了好几年(真是个想法!)现在你必须等待再过50年才能接触到这本书;什么时候不重要它是写的(除非是旧的……在法律颁布之前(倒退到)…所以你必须(平均)等到你那时100岁。根据最初的法律,25岁的孩子会只需等待14年……直到39岁。相当不错差异;年龄在39岁至100岁之间。不仅如此版权法必须一直保持不变……一些令人严重怀疑的事情,看看他们在最近的一个世纪。

古腾堡哲学项目(续)

古腾堡计划的理念是制造信息、书籍和其他以大量形式向公众提供的材料大多数计算机、程序和人都可以很容易地阅读、使用、,引用和搜索。

这有几个影响:

  1. Gutenberg Etexts项目的成本应该很低,没有人会这么做真的很在乎花多少钱。它们应该是一般尺寸符合当时的标准媒体…

  2. Gutenberg Etexts项目应该很容易使用应该关心如何使用、阅读、引用和搜索它们

古腾堡哲学项目(续)

[…]这有几个影响:

  1. Gutenberg Etexts项目的成本应该很低,没有人会这么做真的很在乎花多少钱。它们应该是一般尺寸适合当时的标准媒体。

也就是说,当我们开始时,文件必须非常小,就像正常的300这本书页占据了1971年无人能企及的1兆空间有(一般)。美国独立宣言也是如此(只有5公里)似乎是最好的起点。接下来是《权利法案》(Bill of Rights)——然后是整个美国宪法,因为空间越来越大大型(至少按照1973年的标准)。然后是圣经,因为《圣经》的单本书并没有那么大,然后是莎士比亚(a一次玩),然后在光线和大量文献和参考资料。

当古腾堡计划成名时,标准是360K磁盘,所以我们写了《爱丽丝梦游仙境》或《彼得·潘》等书,因为它们可以放在一个磁盘上。现在1.44是标准磁盘,ZIP是标准压缩;实际文件大小约为300万字符,超过了普通书籍的长度。

然而,图片仍然太大,无法存储在磁盘上,因此它会还有一段时间,我们甚至还没有包括洛厄斯·坦尼埃尔爱丽丝和镜子中的插图。然而,我们非常有兴趣这样做,只等待在发布测试版的技术。市场将不得不然而,在我们尝试之前,先建立一些图形标准以达到一般观众的要求,至少在图形层面。

为了证明我们对图形和未来的信心,我们已经走了在追求我们所称的“复制者”的过程中又向前迈进了一步几年前的技术”TM。我们希望这一阶段的结束古腾堡项目(使用Replicator的第一个3D应用程序技术),通过对可能是一幅画,打印3D副本。如果有人能让我们接触到一本有百年历史的杰作……普通的书。

古腾堡哲学项目(续,2)

[…]这有几个后果:

  1. Gutenberg Etexts项目应该很容易使用应该关心如何使用、阅读、引用和搜索他们。

这就需要在多年来,我们称之为“普通香草ASCII”。

原因很简单……这是唯一的文本模式眼睛和电脑都很容易。

然而,这鼓励其他人在各种方面改进我们的etexts并将其分发到各种可用媒体中,如如下所示:一旦在普通ASCII中创建了一个etext,它就是为任何人都希望在未来。任何想要一个电子文本版本匹配或不匹配特定的纸质版可以很容易地进行他们喜欢的更改,而无需不得不重新准备整本书。他们可以使用该项目Gutenberg Etext作为基础,然后向任何方向建造类似。

因此,任何关于我们如何使用斜体、粗体和强调,或者我们是否应该使用这个或那个标记公式回信时鼓励大家按照任何人想要的方式去做,我们向您致敬,我们已经完成了基础工作。相同的用于媒体。我们有一个长期的职业道德,即提供我们在任何媒体上的其他人都想要:Amiga、Apple、AtariIBM、Mac、TRS-80……然而,现在我们的etexts已经被携带在如此多的BBS、网络和其他位置下载文件时,请使用比我们更适合您的格式可以制作和邮寄磁盘,所以我们实际上不会做太多。

所有这一切的要点是,从现在起几年后的古腾堡计划Etext仍然是可行的,但一个接一个的程序,以及一个接一个的操作系统将走上恐龙,以及运行它们的所有硬件。当然,这对所有普通香草ASCII等文本都有效……不仅仅是你可以从古腾堡计划中获得这些信息关键是十年后我们可能不会有同样的情况操作系统,或相同的程序,因此非普通ASCII的各种etxt将被淘汰。我们需要在文件中有etexts一个普通香草搜索/阅读器程序可以处理;这并不是说不应该有任何标记……只有这些形式的标记才能轻松转换为普通的Vanilla ASCII文件,这样它们的实用程序就不会过期当使用它们的程序不在我们身边时。请记住CONVERT程序无法从旧单词中更改文件将处理器程序转换为普通ASCII?

你想在全世界的每一本书中再次经历这一切吗有没有输入过文本?

普通香草ASCII的值很明显世界上大多数标记系统的价值。但是在一些真正的标准到来之前,我们将限制我们的选择如果我们不在Plain Vanilla中保存所有等文本的副本,那就太棒了ASCII码。我们不反对标记。反之亦然。

《爱丽丝梦游仙境》、《圣经》、莎士比亚、《古兰经》等只要文明……操作系统程序,标记系统……不会。

这尤其包括我们对压缩的许多请求格式。我们知道只有两种格式适合向广大观众传递:普通ASCII(.txt文件)以及其中的ZIPped文件(.zip文件)。其他压缩请求必须忽略格式,因为它们只适用于小型部分目标受众。然而,(程序员注意:我们需要帮助)我们计划在我们的文件,以便可以以任何种类的压缩方式传输动态格式化。即我们应该能够生成任何类型的文件,但我们只能在我们的服务器…作为。Z压缩格式的作用类似今天。

Gutenberg Etexts项目的选择

古腾堡图书馆项目基本上分为三个部分描述如下:

轻文学;比如《爱丽丝梦游仙境》《镜子》、《彼得·潘》、《伊索寓言》等。

重文学;例如圣经或其他宗教文献,莎士比亚、白鲸、失乐园等。

参考文献;例如罗杰的同义词表、年鉴和一套百科全书、词典等。

轻文学集旨在让人们首先,不管这个人是不是学龄前儿童或是一位伟大的家长。我们喜欢听到孩子或爷爷奶奶带着彼此去见彼得·潘看完电影后回来,或者当他们读到《爱丽丝》时在电视上看了《仙境》之后。我们也被告知几乎每部《星际迷航》电影都引用了当前的古腾堡计划释放(摘自《可汗之怒》中的《白鲸》;彼得·潘引用整理最新的等等)更不用提提及通过JFK中的观察镜。当我们为我们的图书馆选书。

我们希望人们能够查找他们在中听到的报价对话、电影、音乐、其他书籍,轻松使用图书馆以易于查找的文本格式包含所有这些引语。

使用Plain Vanilla ASCII,您可以轻松搜索整个没有任何程序比普通搜索更复杂程序。事实上,这些古腾堡Etext项目文件非常简单你甚至不用中间产物就可以对它们进行搜索搜索程序(即您和磁盘之间的程序)Norton’s和其他直接磁盘访问程序可以搜索您的每个文件甚至没有命名它们,指向etext目录,或者无论什么。您可以简单地从磁盘搜索原始输出这是在一个半GB的磁盘分区上,包含我们所有的版本。