书籍描述
这本书由数据库和网络技术领域的权威人士撰写,对学生和从业者来说都是必不可少的阅读材料。网络和互联网商务的普及提供了许多超大数据集,通过数据挖掘可以从中收集信息。
本书重点介绍了用于解决数据挖掘中关键问题的实用算法,这些算法甚至可以成功应用于最大的数据集。它首先讨论了地图还原框架,这是自动并行化算法的重要工具。
作者解释了对位置敏感的散列和流处理算法的技巧,这些算法用于挖掘到达速度过快而无法进行彻底处理的数据。其他章节介绍了PageRank的思想和组织Web的相关技巧,以及查找频繁项集和聚类的问题。
第二版包括对社交网络、机器学习和维度缩减的新的和扩展的报道。
关于作者
- Jure Leskovec是斯坦福大学计算机科学助理教授。他的研究重点是挖掘大型社交和信息网络。
- 阿南德·拉贾拉曼(Anand Rajaraman)是硅谷的一位连续创业者、风险投资家和学者。他是两家早期风险投资公司Milliways Labs和Cambrian Ventures的创始合伙人。
- 杰弗里·大卫·厄尔曼是斯坦福·W·阿斯切曼(Stanford W.Ascherman)计算机科学名誉教授,现任Gradiance首席执行官。他的研究兴趣包括数据库理论、数据挖掘和使用信息基础设施的教育。他是数据库理论领域的创始人之一,是整整一代学生的博士生导师,这些学生后来凭借自己的力量成为领先的数据库理论家。
审查、评级和建议:
相关图书类别:
阅读和下载链接:
类似书籍:
-
-
数据挖掘和分析:基本概念和算法
这本教科书提供了一个广泛而深入的数据挖掘概述,集成了机器学习和统计的相关概念。本书的主要部分包括探索性数据分析、模式挖掘、聚类和分类。
-
-
数据挖掘程序员指南(罗恩·扎查尔斯基)
本书是学习基本数据挖掘技术的工具。如果你是一个程序员,有兴趣学习一些关于数据挖掘的知识,那么作为第一步,你可能会对初学者的实践指南感兴趣。这就是这本书所提供的。
-
-
-
-
-
-
-