-
大数据安全(Shibakali Gupta等人) 在简短描述了大数据的关键概念之后,本书探讨了尤其是基于云的数据存储所带来的保密和安全威胁。 它提供概念框架和模型以及最新技术的案例研究。 -
HPC、大数据和AI向Exascale融合 提供最先进的计算、存储和互连技术的最新愿景,这些技术是 高性能计算(HPC) 、云、大数据和人工智能(AI)领域。 -
用R掌握火花:大尺度分析和建模 通过这本实用的书,数据科学家和从事大规模数据应用程序的专业人员将学习如何使用Spark from R来解决大数据和大计算问题。 -
使用R中的Spark实现任意代码的性能 这本简短的出版物试图提供关于使用sparkyr接口以获得Apache Spark的好处的实际见解,同时仍然保留使用自定义构建函数和包中组织的R代码的能力。 -
定性研究的大数据(凯西·米尔斯) 本书探讨了大数据定性方法和分析的潜力,涵盖了小数据研究人员需要了解的关于大数据的一切,从大数据分析的潜力到其方法学和道德挑战。 -
大数据处理工程(Piotr Fulman nski) 本书面向所有想了解大数据与数据的区别以及为什么应该以不同的方式对待他们的人。 这可能对没有计算机科学家背景的人和有一些It经验的人都有好处。 -
大数据算法(Hannah Bast等人) 这本开放存取书籍调查了与大数据增长以及日益复杂的硬件相关的选定挑战的解决进展。 解决交通系统、能源供应、医疗等问题。 -
工程化敏捷大数据系统(Kevin Feeney等) 本书概述了处理软件和数据工程中问题的方法,描述了在产品生命周期中调整这些过程的方法。 它讨论了可用于实现这些目标的工具。 -
知识图和大数据处理(Valentina Janev等人) 本书的每一章都阐述了数据处理链的一些相关方面,特别侧重于理解企业 知识图 语义大数据架构和智能数据分析解决方案。 -
背景下的大数据:法律、社会和技术见解 这本书从跨学科的角度为大数据场景的选择提供了新的视角。 它全面概述并介绍了大数据方面正在出现的挑战。 -
大数据应用的建模与仿真 长期以来被认为是科学方法的重要支柱,建模和仿真已经从传统的离散数值方法发展到复杂的数据密集型连续分析优化。 -
卡夫卡:最终指南:实时数据和流处理 通过详细的示例,您将了解 卡夫卡 的设计原则、可靠性保证、关键API和体系结构细节,包括复制协议、控制器和存储层。 -
设计事件驱动系统(Ben Stopford) Apache Kafka流服务的概念和模式:这本书解释了基于服务的架构和流处理工具如何 阿帕奇·卡夫卡 可以帮助您构建业务关键型系统。 -
理解流处理:Apache Kafka背后 本书向您展示了流处理如何使您的数据存储和处理系统更灵活、更简单。 它解释了这些项目如何帮助您围绕流和物化视图重新定位数据库架构。 -
使用Apache Spark(Srini Penchikala)进行大数据处理 了解 阿帕奇火花 为大数据分析中的用例构建和开发Spark程序。 它涵盖了Spark生态系统中的所有库,其中包括Spark Core、Spark SQL、Spard Streaming、Spark-MLlib和Spark GraphX。 -
Apache Spark的内部结构(Jacek Laskowski) 本书介绍了 阿帕奇火花 是一个开源集群计算系统,它使数据分析能够快速写入和运行。 使用Spark,您可以通过Python、Java和Scala中的简单API快速处理大数据集。 -
Apache Spark(Databricks)数据工程师指南 这本书是为数据工程师准备的,他们希望利用Apache Spark的巨大增长来构建更快、更可靠的数据管道。 它利用Spark惊人的速度、可扩展性、简单性和多功能性来构建实用的大数据解决方案。 -
预测:原理与实践(Rob J.Hyndman等人) 这本教科书全面介绍了预测方法,并提供了关于每种方法的足够信息,以供读者合理使用。 示例使用R,其中有许多数据集取自作者自己的咨询经验。 -
大CPU、大数据:解决世界上最棘手的问题 本书的目标是教你如何编写并行程序,充分利用现代多核计算机、计算集群和图形处理单元(GPU)加速器的强大处理能力。 -
大数据议程:数据伦理和关键数据研究 本书强调,收集、分析和利用大量数字(用户)数据的能力引发了重大的道德问题。 具体案例研究探讨了大数据在学术工作中的使用情况。 -
大数据人工智能(Anand Deshpande等人) 您将学习使用机器学习算法,如k-means、SVM、RBF和回归来执行高级数据分析。 您将了解机器和深度学习技术的现状,以研究遗传和神经模糊算法。 -
Hadoop 3大数据分析(Sridhar Alla) 本书向您展示了如何将Hadoop与许多其他大数据工具结合起来,通过实际示例提供对软件的深入了解及其好处,从而构建强大的分析解决方案。 -
使用Python的Hadoop(Zachary Radtka等人) 本书将带您了解Hadoop、MapReduce、Pig和Spark背后的基本概念。然后,通过多个示例和用例,您将学习如何通过应用各种Python工具来使用这些技术。 -
Hadoop for Windows简洁(Dave Vickers) 本书提供了在Windows操作系统上直接使用Hadoop的详细指南。 从概念概述到实际示例,Hadoop for Windows Succinctly对开发人员来说是一个宝贵的资源。 -
Hadoop Succinctly(埃尔顿·斯通曼) 这本书解释了Hadoop是如何工作的,集群中发生了什么,演示了如何将数据移入和移出Hadoop,以及如何高效地查询数据。 它还介绍了一个Java MapReduce示例,并用Python和进行了说明。 NET也是。 -
Hadoop照明(Mark Kerzner等人) 本书旨在使Hadoop知识能够为更广泛的受众所用,而不仅仅是高技术人员。 这本书向您介绍了Hadoop和“MapReduce”等概念,这将帮助您熟悉该技术。 -
理解大数据:Hadoop和流数据分析 在本书中,讨论了大数据的三个定义特征——数量、多样性和速度。 本实用指南还包括行业用例,以提供一个强大、安全、高可用的企业级大数据平台。 -
数据新闻手册:走向关键数据实践 这本书对 数据双重性 结合批判性反思和实际洞察力。 它既是这一新兴领域的教科书,也是一本资料书。 -
O'Reilly®《数据新闻手册》(Jonathan Gray等人) 本书旨在为那些认为自己可能有兴趣成为数据记者或涉足其中的人提供有用的资源 数据双重性 ,旨在回答以下问题:我在哪里可以找到数据? 我如何请求数据? 等。 -
《好奇记者的数据指南》(乔纳森·格雷) 这是一本关于在新闻业中使用数据的书,但它不是一本特别实用的书。 相反,它是为那些好奇的人,为那些想知道将一切结合在一起的深刻想法的人准备的。 实践 数据双重性 . -
现实世界应用大数据(Sebastian Ventura Soto) 本书的目的是为读者提供各种领域和系统,在这些领域和系统中,大数据的分析和管理至关重要。 它描述了大数据时代的重要性以及如何适应现有信息系统。 -
处理大数据时的科学推断概念 在处理大数据时,检查可靠地进行科学推断的关键挑战和机遇,重点关注可用数据和应用的统计模型的适用性,大数据分析可能会导致误导性相关性。 -
颠覆性可能性:大数据如何改变一切 本书将带您踏上探索大数据新兴世界的旅程,从相对简单的技术到它与云计算的不同之处。 它通过广泛的主题提供了历史性的概述。 -
大数据的前景和危险(大卫·博利尔) 这本书探讨了当移动网络、云计算和其他新技术产生的不断增加的数据洪流与先进相关技术的持续创新相结合时,会出现的积极方面和社会风险。 -
数据流的机器学习:MOA中的实例 本书介绍了数据流挖掘和实时分析中使用的算法和技术。 它采用实际操作的方法,使用MOA(Massive Online Analysis,大规模在线分析)演示了这些技术,MOA是一个流行的、免费可用的开源软件框架,允许读者在阅读解释后尝试这些技术。 -
O'Reilly®Big Data Now:O'Relly雷达的当前观点 本书代表了对趋势、工具、应用程序和预测的报告概述。 这组博客帖子由该领域的顶尖思想家和专家撰写,反映了一组独特的主题,我们认为这些主题正在引起人们的极大关注和关注。 -
O'Reilly®大数据规划:不断变化的数据环境 本书提供了一份高效、用户友好的“简报”,介绍了大数据分析的现状,以及如何经济地部署这项技术来提高公司的盈利能力。 -
使用MapReduce进行数据完整文本处理(Jimmy Lin) 这本免费书重点介绍MapReduce算法设计,重点介绍自然语言处理、信息检索和机器学习中常见的文本处理算法。 -
海量数据集的挖掘(A.Rajaraman,J.D.Ullman) 本书讲授了在实践中用于解决数据挖掘关键问题的算法,并包括适合高级本科生及更高级别学生的练习。 -
Microsoft Azure HDInsight简介-技术概述 本书涵盖了大数据的真正含义,如何在公司或组织中利用大数据实现优势,以及可以快速实现这一目标的服务之一。 特别是微软的HDInsight服务。 -
HDInsight Succinctly(詹姆斯·贝雷斯福德) 了解如何在Azure上设置和管理HDInsight群集,如何使用Azure Blob Storage存储输入和输出数据,如何与Microsoft BI连接,等等。 它将揭示数据管理的新途径。 -
O'Reilly®敏捷数据:构建数据分析应用程序 如何使用轻量级工具(如Ruby、Python、Apache Pig和D3.js(data-Driven Documents)JavaScript库)创建数据浏览环境。 -
第四种范式:数据密集型科学发现 这本书首次对迅速崛起的数据密集型科学领域进行了广泛审视,其目标是影响全球科学和计算研究社区并激励下一代科学家。 -
开放数据的全球影响:案例研究的主要发现 开放数据促进了经济创新、社会转型等。本书介绍了世界各地开放数据项目的详细案例研究,以及对哪些可行,哪些不可行的深入分析。