大型数据存储库的创建一直是社会和智力发展的关键历史指标,实际上可能是整个文明进步的决定性特征之一。
通过我们对Wolfram | Alpha的研究,我们对系统数据有着永不满足的胃口,我们对当今世界上存在的许多伟大的数据存储库有了一个独特的广泛视角。
其中一些存储库由国家或国际机构维护,一些由公司和其他组织维护,一些则由个人维护。其中一些存储库是相当新的,但许多存储库可以追溯到40年或更长的时间,有些存储库甚至超过了一个世纪。但是,基本上每一个伟大的数据存储库都有一个共同点:一个勤勉尽责的核心人员,他们仔细地指导着它的开发。
然而,奇怪的是,这些人中很少有人见过其他数据领域的同行。在我们关于Wolfram | Alpha的工作中,我们几乎可以肯定是第一个有幸结识如此广泛的大型数据存储库领导者的团队。
我们发现,这些数据存储库使用的方法和面临的问题有很多共同之处。因此,作为我们对全球数据社区贡献的一部分,我们决定主办一次数据峰会,首次将当今伟大数据存储库的领导者聚集在一起。
这个2010年Wolfram数据峰会将于9月9日至10日在华盛顿特区举行。
我们邀请了社会经济、科学、金融、医学、地理、商业、词典学、文化、传记、数学等各个领域的数据仓库领导者。我们已经知道,许多数据存储库将被表示出来,例如英国广播公司,鲍克,CABI公司,疾病预防控制中心,市场份额,CRC公司,DataONE公司,生命百科全书,联邦调查局,联邦储备银行,大风,国际货币基金组织,Internet存档,穆迪公司,美国国家航空航天局,美国国立生物技术信息中心,NIST标准,国家可再生能源研究所,国家科学基金会, 美国管理和预算局,打开库,开放树映射,学位论文全文数据库,蛋白质数据库,史密森学会,阳光基金会,路透社,联合国教科文组织,联合国儿童基金会,美国人口普查,美国运输部,美国教育部,世界银行、和世界保护监测中心-以及其他许多人。
在数据峰会上有很多内容需要讨论。数据管理方面的经验和最佳实践。数据应如何组合、验证和标准化。从自动化传感器到众包如何影响数据收集。政府和组织的数据政策是如何演变的,应该如何演变。如何处理尚未采用数字形式的数据。隐私和商业问题如何影响数据传播。还有很多很多。
这是数据历史上的一个独特时刻:随着科学和分析方法在全世界越来越突出和成功,组织和个人都在根据数据做出越来越多的重要决策。随着计算机、网络和现在的移动设备变得无处不在,数据可以比以往更广泛地传播。
然而,要以一种对广泛人群立即有用的方式做到这一点是一件困难的事情。这是我们试图通过在Wolfram|Alpha中使知识和数据可计算来实现的目标的一部分。
事实上,在这样做的过程中,我们还看到了其他一些东西:如果数据可以统一计算,那么通过组合非常不同类型的数据,就有可能获得全新的事实和知识,从而产生比任何数据存储库本身都能获得的价值要大得多的价值。
多年来,世界上伟大的数据存储库中仔细收集和组织了大量数据,这确实令人印象深刻。今天,这些数据将在世界各地的人们日常生活中变得更加相关和重要。
我们希望,今年9月的数据峰会将有助于突出全球数据社区迄今取得的巨大成就,并将成为社区发展下一阶段的催化剂。
我本人一生都热衷于系统数据,几十年来直接负责收集大量数学的和计算的数据。对我来说,伟大的数据存储库是现代世界的奇迹,是我们文明在许多不同领域所取得成就的纯粹而有形的体现。
我期待着今年9月我们的数据峰会取得进展,也期待着听到来自数据世界第一线的所有精彩故事。
注:今年,数据峰会是一项仅限免费邀请的活动,但我们希望所有相关人士都能参加,因此我们鼓励应用用于邀请来自合格人员。