系统数据的时间线与可计算知识的发展

文明如何系统化了越来越多的知识领域,收集了与之相关的数据,使之适应自动化和计算。
系统数据的时间线和可计算知识的发展:1960—2010

一千九百六十

1960:超文本

想象世界知识的连通性

文档之间的链接概念开始被讨论为组织文本材料和知识的范例。

1960:全文检索

无索引查找文本

证明了计算机对文档的第一次全文检索。

1960:医学主题词(Mesh)

组织世界医学知识

网状医学词典的第一个版本开始使用。

1962:第一GIS系统

地理信息计算机化

Roger Tomlinson开创了加拿大地理信息系统,创建了第一个GIS系统。

1963:邮政编码

邮政编码(分区改善计划)代码是由美国邮政局推出的。

1963:字符码

每封信的标准号码

ASCII代码为英语中的每个字符定义了一个标准位表示。

1963:科学引文索引

引文测绘科学

尤金·加菲尔德出版了《科学引文索引》的第一版,该索引通过论文中的参考文献来索引科学文献。

1963:数据通用编号系统(D-U-N-S)

每个企业都有一个数字

Dun&BrdSt街开始给每个公司分配一个唯一的数字。

1964:Abramowitz和Stegun

数学函数的收集

国家标准局(NIST)公布了许多高等数学函数的表和性质。

1966:信息自由法

美国总统林顿约翰逊将法案签署为法律,强制公众获取政府记录。

1966:SBN码

每本书都有一个数字

介绍了英国SBN码,后来在1970推广到ISBN。

1967:对话

从任何地方检索信息

对话在线信息检索系统可从远程位置访问。

1968:马克

亨利特.艾夫拉姆在国会图书馆创建了机器可读编目系统,定义了图书的制版标准。

一千九百七十

20世纪70年代:关系数据库

数据可计算关系的建立

关系数据库和查询语言允许大量的数据以某种方式存储,使得某些常见类型的查询能够高效地作为业务的常规部分来完成。

1970—1980年代:交互式计算

从计算机获得即时结果

随着越来越便宜的计算机的出现,有可能立即进行计算,将它们作为日常工作的一部分。

1970—1980年代:专家系统

作为推理规则捕获专家知识

在很大程度上,作为一个分支AI,专家系统是试图捕捉人类专家在专门领域的知识,使用基于逻辑的推理系统。

1972:凯伦·斯巴克·琼斯

逆文档频率

凯伦Sp Ruk琼斯是一位以信息检索和自然语言处理著称的计算机科学家,他负责的是反向文档频率的概念,这是大多数现代搜索引擎的基础。

1973:词汇

法律信息上网

LoCISS在在线检索系统中提供了美国法院意见的全文记录。

1973:尼尔·斯洛恩

Neil Sloane开始列出整数的“有趣”序列。

1973:布莱克-斯科尔斯公式

把数学引入金融衍生品

费希尔·布莱克迈伦·斯科尔斯给出股票期权定价的一种数学方法。

1974:UPC码

每个产品都有一个数字

条形码的UPC标准启动了。

1976:国际标准序列号

系列出版物的系统化

国际标准化组织(ISO)实现了一个八位数字编码系统,作为学生、图书馆员和研究人员的书目工具,以唯一地标识文章、特定的文本卷和其他系列化出版物。

一千九百八十

20世纪80年代:神经网络

模仿大脑处理知识

在20世纪40年代的前体,神经网络出现在20世纪80年代作为一个概念,存储和操作各种类型的知识,使用联想神经细胞。

1982:基因银行

收集生活守则

Walter Goad在洛斯阿拉莫斯创立GenBank以收集所有的基因组序列。

1983:域名服务器

创建层次化Internet地址的域名系统;在1984,命名为COM和其他顶级域(TLDS)。

1984:CYC

创建可计算的常识数据库

CYC是一个长期运行的项目,以可计算的形式编码常识事实。

1988:数学软件

算法计算语言

Mathematica的创建是为了通过定义符号语言来表示任意的构造,然后组装一个巨大的一致算法的网络来对它们进行运算,从而为各种形式的算法计算提供统一的系统。

1989:万维网

收集世界信息

万维网不断增长,从文明的各个角落提供数十亿页的免费信息。

一千九百九十

1990:IMDB

索引电影

互联网电影数据库启动。

1991:地鼠

在互联网上掘洞

GopHER提供了一种基于菜单的系统,用于查找与互联网相连的计算机上的材料。

1991:统一码

代表每种语言

Unicode标准为每个人类语言中的每一个符号分配一个数字代码。

1993:蒂姆·伯纳斯-李

网络目录

蒂姆·伯纳斯-李创建虚拟图书馆,第一个系统化的Web目录。

1993:安全散列算法

规范SHA-0算法由NIST出版。

1994:雅虎!

杨致远大卫·费罗创建Web的层次目录。

1994:QR码

快速响应(QR)可扫描条形码是在日本创建的,用于编码计算机眼睛读取的信息。

1995:CDDB

索引音乐

Ti Kan用CDDB索引CDS,这就变成了GraceNoT。

1996:互联网档案馆

拯救网络的历史

布鲁斯特·卡利创建互联网档案馆,开始系统地捕捉和存储网络的状态。

1998:谷歌

搜索引擎的引擎

谷歌和其他搜索引擎提供了高效的能力来在整个Web内容上进行文本搜索。

1999:物联网(物联网)

物联网(IOT)是嵌入连接和软件的物理设备的互联网络,这些软件使这些对象能够收集和交换数据。

二千

2000:斯隆数字巡天

映射宇宙中的每一个物体

斯隆数字天空调查花费了近十年自动绘制天文宇宙中所有可见物体的地图。

2000:数字目标标识符

DOI作为持久句柄是标准化的

任何科学文献的指纹,数字对象标识符增加了科学出版物的可见性和访问性,同时确保每个作品的知识产权保持完整。

2000:万维网2

社会组织信息

社交网络和其他集体网站定义了一种机制,用于集体地和关于人的信息组装。

2001:维基百科

自组织百科全书

志愿者贡献者汇集了数百万页的百科全书资料,提供了几乎所有人类知识领域的文本描述。

2002:一种新的科学

探索计算宇宙

斯蒂芬·沃尔夫勒姆探索可能的简单程序的宇宙,并表明,关于许多自然和人工过程的知识可以用令人惊讶的简单程序来表示。

2003:人类基因组计划

人类的完整代码

人类基因组计划宣告完整,为每个人找到一个参考DNA序列。

2004:脸书

捕捉社交网络

脸谱网开始大规模地捕捉人与人之间的社会关系。

2004:OpenStruts地图

Steve Coast发起了一个项目来创建一个拥挤的街道级地图的世界。

2008:块链

密码事务和分布式分类帐

Satoshi Nakamoto发明BitCu链作为比特币的公共交易分类帐。

2009:可穿戴生物特征识别装置

像FITBIT这样的消费电子公司开始发布通过信号处理跟踪移动、步骤和心率的活动跟踪器,通过互联网上传数据到云服务进行处理和分析。

2009:沃尔夫拉姆阿尔法

计算知识引擎

WalfRAM-Alpha是一个基于大量算法和精明数据计算自然语言查询答案的网站。

二千零一十

2012:奥西德

OrCID独特地识别科学和学术作者和贡献者。

2014:数字助理

数字助理,如西丽,Cortana和Alexa,执行数字语音识别,以自动化各种消费或工业应用变得流行。

2017:WOLFRAM数据仓库

使公共数据可计算

WOLFRAM数据仓库使公共数据可计算和可访问,同时也使其安全地存储。

参见:史蒂芬·沃尔弗拉姆的博客:数据文明的进展:时间线