-
使用Python进行数据分析(Numpy、Matplotlib和Pandas) 使用Python,通过本实用指南了解使用机器学习算法和技术的数据分析管道。 具备准备数据进行分析的技能,并创建有意义的数据可视化,以便从数据中预测值。 -
用R进行数据挖掘:用案例学习(路易斯·托戈) 向读者介绍R作为执行数据挖掘、统计计算和图形的工具的使用。 大量可用的软件包使该工具成为现有(而且价格昂贵!)数据挖掘工具的优秀替代品。 -
R和Python数据分析简介 本书帮助学生同时使用R和Python编写代码。 这本书是以一种吸引人的合作风格写成的,这使它读起来很愉快。 它保持了其正式性,而不会在读者和内容之间造成障碍。 -
用于数据分析的Python:Pandas、NumPy和Jupyter 重点是Python编程、库和工具,而不是数据分析方法。 这是数据分析所需的Python编程。 在此过程中,您将学习熊猫、NumPy和Jupyter的最新版本。 -
计量经济学、统计和数据分析用Python 这本书是为那些刚接触统计计算的人设计的,他们希望发展一套必要的技能,以便使用Python进行计量经济学、统计学或一般数值分析的原始研究。 -
分析美国人口普查数据:R中的方法、地图和模型 本书向读者介绍了R编程语言中用于访问和分析美国人口普查局人口普查数据的工具,并展示了如何在单一计算环境中进行人口统计分析。 -
人员分析基础:在R中的应用 人力资本是组织最重要的资产。 使用开源软件,通过策划跨越整个分析生命周期的关键概念,以及针对实际问题的应用程序的逐步说明,来满足这一需求。 -
R(Matthias Kohl)统计数据分析简介 这本书介绍了使用免费统计软件R进行统计数据分析,该软件可能是当今最强大的统计软件。 使用实际数据进行分析和讨论。 -
元学习:在AutoML和数据挖掘中的应用 本书全面全面地介绍了元学习和 自动机器学习(AutoML) 它可以帮助开发人员开发能够通过经验改进自己的系统。 -
卡夫卡:最终指南:实时数据和流处理 通过详细的示例,您将了解Kafka的设计原则、可靠性保证、关键API和体系结构细节,包括复制协议、控制器和存储层。 -
理解流处理:Apache Kafka背后 本书向您展示了流处理如何使您的数据存储和处理系统更灵活、更简单。 它解释了这些项目如何帮助您围绕流和物化视图重新定位数据库架构。 -
实际数据可视化:从电子表格到代码 本书将带您逐步了解教程、真实示例和在线资源。 这本实用指南非常适合那些想从电子表格中提取数据并将其转化为生动的交互式故事的人。 -
数据可视化基础:信息性图形 本书将带您了解许多常见的可视化问题,并提供了如何将大型数据集转换为清晰、引人注目的图形的指南,还将教您成功实现数据可视化最关键的要素。 -
数据可视化:实用介绍(基兰·希利) 它为学生和研究人员提供了数据可视化原理和实践的动手介绍。 它解释了是什么使一些图形成功而另一些图形失败,以及如何使用强大且可复制的方法从数据中生成高质量的图形。 -
科学可视化:Python和Matplotlib(Nicolas P.Rougier) Matplotlib提供了一个可定制绘图的大型库,以及一组全面的后端。 通过实际、动手和简单的示例,本书指导您使用Python和Matplotlib完成数据可视化和探索。 -
从基本观点进行高级数据分析 这是一本关于数据分析方法的教科书,面向已经上过概率、数理统计和线性回归课程的高年级本科生。 它假定您可以在R中读写简单的函数。 -
海量数据集的挖掘(Jure Leskovec等人) 它专注于已用于解决数据挖掘中的关键问题并可成功应用于最大数据集的实用算法。 它首先讨论了地图还原框架,这是自动并行化算法的重要工具。 -
数据挖掘中的光谱特征选择(Zheng A.Zhao等) 本书介绍了一种新的特征选择技术,该技术为研究现有的特征选择算法和为现实应用中出现的问题开发新的算法建立了一个通用平台。 -
预测:原理与实践(Rob J.Hyndman等人) 这本教科书全面介绍了预测方法,并提供了关于每种方法的足够信息,供读者合理使用。 示例使用R,其中有许多数据集取自作者自己的咨询经验。 -
贝叶斯数据分析(Andrew Gelman等人) 这本经典的书被广泛认为是贝叶斯方法的主要文本,因其分析数据和解决研究问题的易用、实用的方法而备受赞誉。 它采用一种实用的方法,使用最新的贝叶斯方法进行分析。 -
数据挖掘和分析:基本概念和算法 这本教科书提供了一个广泛而深入的数据挖掘概述,集成了机器学习和统计的相关概念。 本书的主要部分包括探索性数据分析、模式挖掘、聚类和分类。 -
用数据回答问题(Matthew Crump等人) 这是一本免费的本科生统计学入门教材。 学生将学习选择适当的数据分析技术,进行分析,并得出适当的结论。 -
R的探索性数据分析(Roger D.Peng) 本书涵盖了用R总结数据的基本探索技术。这些技术通常在正式建模开始之前应用,可以帮助开发更复杂的统计模型。 -
基本数据分析及更多内容-使用Python的导览 在本书中,将介绍和说明一些常用的统计工具。 本文提供了使用Python编程语言的所述技术的示例性实现。 -
使用R进行文本挖掘:一种整洁的方法(Julia Silge等人) 您将使用tidytext探索文本挖掘技术,这是一个作者使用ggraph和dplyr等R包背后的整洁原则开发的包。 您将了解R中的tidytext和其他整洁工具如何使文本分析更容易、更有效。 -
高级文本挖掘理论与应用(S.Sakurai) 本书介绍了高级文本挖掘技术。 它们是从关系提取到资源不足或不足的语言的各种技术。 为了从数据中提取知识,文本挖掘技术已经得到了积极的研究。 -
Python中的文本处理(David Mertz) 这本书是一个示例驱动的实践教程,它仔细地教程序员如何使用Python语言完成大量文本处理任务。 它为特定的文本处理问题提供了高效的解决方案。 -
挖掘社交媒体:在互联网数据中寻找故事 本书向您展示了如何使用Python和关键数据分析工具来查找隐藏在社交媒体中的故事。 使用Python执行高级数据分析, Jupyter笔记本 、和 熊猫 库。 -
大众数据挖掘(Matthew North) 本书使用简单的示例、清晰的解释和免费、强大、易于使用的软件来教您数据挖掘的基础知识; 可以帮助您回答一些最棘手的业务问题的技术。 -
数据挖掘程序员指南(罗恩·扎查尔斯基) 本书是学习基本数据挖掘技术的工具。 如果你是一个有兴趣学习一些数据挖掘知识的程序员,你可能会对初学者的动手指南感兴趣,作为第一步。 这就是这本书的内容。 -
数据挖掘简介(Saed Sayad博士) 本书为首次学习数据挖掘的人介绍了基本概念和算法,提供了所有数据挖掘主题的理论和实践覆盖。 包括大量综合示例和数字。 -
知识图谱和大数据处理(Valentina Janev等人) 本书的每一章都阐述了数据处理链的一些相关方面,特别侧重于理解企业 知识图 语义大数据架构和智能数据分析解决方案。 -
大数据的前景和危险(大卫·博利尔) 本书探讨了当移动网络、云计算和其他新技术产生的不断增加的数据洪流与先进关联技术的持续创新相结合时,出现的积极方面和社会风险。 -
医学和生物学研究中的数据挖掘 本书旨在汇集世界各地医学和生物学领域中数据挖掘研究的最新进展和应用。 它有十二章与医学研究有关,五章侧重于生物学领域。 -
数据流的机器学习:MOA中的实例 本书介绍了数据流挖掘和实时分析中使用的算法和技术。 它采用实际操作的方法,使用MOA(Massive Online Analysis,大规模在线分析)演示了这些技术,MOA是一个流行的、免费可用的开源软件框架,允许读者在阅读解释后尝试这些技术。 -
足够了R:用R在一天内学习数据分析(S.Raman) 学习R编程,在一天内进行数据分析。 这本书旨在向任何已经掌握其他语言编程的人教授在一天内使用R进行数据分析。 -
使用R的线性回归:数据建模简介 本书以非正式的教程风格介绍了一种基本的数据建模技术。 学习如何使用详细的逐步过程来开发、训练和测试可靠的回归模型,从测量数据中预测系统输出。 -
数据科学手册:建议和见解 本书涵盖了用R总结数据的基本探索技术。这些技术通常在正式建模开始之前应用,可以帮助开发更复杂的统计模型。 -
探索数据科学(Nina Zumel等人) 本书向读者介绍了数据科学的各个领域,并通过R、Python和其他语言的实际示例解释了哪种方法最适合每种方法。 -
掌握Apache Spark 2.0(Jacek Laskowski) 本书介绍了Apache Spark,这是一个开源集群计算系统,它使数据分析能够快速写入和运行。 使用Spark,您可以通过Python、Java和Scala中的简单API快速处理大数据集。 -
现实世界应用大数据(Sebastian Ventura Soto) 本书的目的是为读者提供各种领域和系统,在这些领域和系统中,大数据的分析和管理至关重要。 它描述了大数据时代的重要性以及如何适应现有信息系统。 -
数据同化:数学导论(Kody Law等人) 本书系统地介绍了数据同化工作的数学基础,涵盖了理论和计算方法。 特别地,作者开发了贝叶斯公式的统一数学框架。 -
数据科学导论(杰弗里·斯坦顿) 本书为非技术性读者提供了数据科学基本概念和活动的温和介绍。 对于更多的技术读者,本书使用开源R语言为统计计算和图形提供了一系列有趣的应用程序的解释和代码。 -
分析语言数据:使用R的统计学导论 语言统计分析的简单介绍,专为非数学背景的人设计。 使用领先的统计程序“R”。 适用于所有使用定量语言数据的人。 -
空间数据处理的Python脚本(Pete Bunting等) 本书是面向初学者的Python教程,旨在教授空间数据处理。 它被用作英国阿伯里斯特威斯大学遥感和地理信息系统课程的一部分,使用psycopg2和ogr2ogr等。 -
Think Stats,第二版:Python中的探索性数据分析 这个简明的介绍向您展示了如何使用Python编写的程序以计算方式而非数学方式执行统计分析。 -
数据学院手册 本教材将提供详细的背景理论,以支持数据科学课程和挑战。 它将指导您完成数据项目的关键阶段。 这些阶段可以被认为是一个管道或过程。 -
推特数据分析(Shamanth Kumar等人) 本书提供了利用推特数据发现复杂查询解决方案的方法。 该简介介绍了通过Twitter的API收集数据的过程,并提供了管理大型数据集的策略。 -
机器学习和数据挖掘(Aaron Hertzmann) 这是对与机器学习基础和数据挖掘中使用的算法相关的主要问题的介绍。 它为机器学习概念提供了基础,也为实际数据挖掘技术提供了实用建议。 -
社交媒体挖掘:简介(Reza Zafarani等人) 本教材介绍了社交媒体数据产生的独特问题,并介绍了网络分析和数据挖掘的基本概念、新兴问题和有效算法。 -
O'Reilly®生物信息学数据技能(文斯·布法罗) 这本实用书教授了科学家将大型测序数据集转化为可重复且可靠的生物学发现所需的技能。 它要求通过数据技能来实践生物信息学。 -
挖掘Web:从超文本数据中发现知识 这是第一本完全致力于从大量非结构化Web数据中生成知识的技术的书。 基于对基础设施问题的初步调查,包括Web爬行和索引。 -
假人数据融合(迈克尔·韦斯勒) 本书帮助您了解数据混合的好处,并了解如何构建满足组织分析需求所需的数据集,而无需编写脚本或等待其他部门。 -
Hadoop Succinctly(埃尔顿·斯通曼) 这本书解释了Hadoop是如何工作的,集群中发生了什么,演示了如何将数据移入和移出Hadoop,以及如何高效地查询数据。 它还介绍了一个Java MapReduce示例,并用Python和进行了说明。 NET也是。 -
Hadoop照明(Mark Kerzner等人) 本书旨在使Hadoop知识能够为更广泛的受众所用,而不仅仅是高技术人员。 这本书向您介绍了Hadoop和“MapReduce”等概念,这将帮助您熟悉该技术。 -
颠覆性可能性:大数据如何改变一切 本书将带您踏上探索大数据新兴世界的旅程,从相对简单的技术到它与云计算的不同之处。 它通过广泛的主题提供了一个历史性的概述。 -
O'Reilly®Big Data Now:O'Relly雷达的当前观点 这本书代表了我们去年在O'Reilly Radar上发布的所有与数据相关的内容。 -
用于计量经济学、统计学和数据分析的Python 这本书为初学者介绍了Python。 对于有兴趣使用NumPy、SciPy和matplotlib进行数值和统计分析的经验丰富的Python程序员来说,它们也可能很有用。 -
O'Reilly®挖掘社交网络,第2版(Matthew A.Russell) 这本书向你展示了如何回答这些问题,例如,你如何利用社交数据,发现谁在与谁联系,哪些见解隐藏在表面之下,以及人们在谈论什么? -
统计方法及其在实际问题中的应用 本书提供了一个跨学科的论坛,用于探索不同领域出现的各种新数据分析技术,重点关注许多不同研究领域中数据分析技术的最新进展。 -
数据挖掘新基础技术(Kimito Funatsu) 本书将使您彻底熟悉新一代数据挖掘工具和技术,并向您展示如何使用它们做出更好的业务决策。 -
基本数值方法和数据分析(G.W.Collins) 本书的基本前提是,它可以作为讨论数据分析和科学中使用的数值方法的广泛课程的基础。 -
O'Reilly®敏捷数据:构建数据分析应用程序 使用Ruby、Python、Apache Pig和D3.js(data-Driven Documents)JavaScript库等轻量级工具创建一个用于探索数据的环境。 学习一种迭代方法,使您能够快速更改正在进行的分析类型。 -
使用R进行数据分析和绘图(J H Maindonal) 本书指导用户使用R系统提供的实用、强大的工具。 重点是动手分析、图形显示和数据解释。 -
数据挖掘知识发现与应用进展 本书旨在帮助希望应用数据挖掘技术的数据矿工、研究人员、学者和学生。 -
数据仓库入门(Neeraj Sharma等人) 这本书是为那些对数据库接触有限并且希望学习端到端数据仓库概念的数据仓库爱好者而写的。 -
R:数据分析编程环境简介 本教程手册全面介绍了R,这是一个用于统计计算和图形的开源软件包。 -
数据挖掘在工程和医学中的应用 本书旨在帮助希望应用不同数据挖掘技术的数据矿工,包括统计学、机器学习、数据管理和数据库、模式识别、人工智能等。 -
O'Reilly®《数据新闻手册》(Jonathan Gray等人) 本书旨在为那些认为自己可能有兴趣成为数据记者或涉足其中的人提供有用的资源 数据双重性 ,旨在回答以下问题:我在哪里可以找到数据? 我如何请求数据? 等。 -
理解大数据:Hadoop和流数据分析 在这本免费书中,讨论了大数据的三个定义特征——数量、多样性和速度。 本实用指南还包括行业用例。 -
使用MapReduce进行数据完整文本处理(Jimmy Lin) 这本免费书重点介绍MapReduce算法设计,重点介绍自然语言处理、信息检索和机器学习中常见的文本处理算法。 -
O'Reilly®大数据规划:不断变化的数据格局 就大数据分析的当前状态以及如何经济地部署此技术以提高公司的盈利能力提供高效、用户友好的“简介”。 -
数据挖掘中面向知识的应用程序(Kimito Funatsu) 关于数据挖掘技术在营销和客户关系管理中的应用的完整而全面的手册。 它结合了技术和业务角度,弥合了数据挖掘及其在营销中的应用之间的差距。 -
统计学习的要素:数据挖掘、推理等。 这本书在一个通用的概念框架中描述了这些领域的重要思想。虽然方法是统计的,但重点是概念而不是数学。 -
Microsoft Azure HDInsight简介-技术概述 本书涵盖了大数据的真正含义,如何在公司或组织中利用大数据实现优势,以及可以快速实现这一目标的服务之一。 特别是微软的HDInsight服务。 -
HDInsight Succinctly(詹姆斯·贝雷斯福德) 了解如何在Azure上设置和管理HDInsight群集,如何使用Azure Blob Storage存储输入和输出数据,如何与Microsoft BI连接,等等。 它将揭示数据管理的新途径。 -
生物学中的大规模数据处理(Karol Kozak) 该书涵盖了数据存储系统、生物问题的计算方法、工作流系统简介、数据挖掘、数据可视化,以及根据个人研究需求定制现有数据分析软件的技巧。 -
Python for Informatics:探索信息(严重程度) 本书中采用的计算机科学方法和信息学方法的主要区别在于,它们更注重使用Python解决问题。 -
数据挖掘桌面生存指南(Graham William) 本书将使您彻底熟悉新一代数据挖掘工具和技术,并向您展示如何使用它们做出更好的业务决策。 假设之前不了解R或数据挖掘/统计技术。 -
第四种范式:数据密集型科学发现 这本书首次对迅速崛起的数据密集型科学领域进行了广泛审视,其目标是影响全球科学和计算研究社区并激励下一代科学家。 -
数据仓库入门(Neeraj Sharma等人) 这本书是为那些对数据库接触有限并且希望学习端到端数据仓库概念的数据仓库爱好者而写的。 了解数据仓库的全部内容,并使用实际操作练习进行练习。 -
数据建模:科学计算的工具和技术 使用数据建模充分解释了如何对超大数据集执行计算密集型分析,向读者展示了如何确定解决各种不同问题的最佳方法等。。 -
实际应用中的数据挖掘和知识发现 这本书介绍了四种不同的方法,即数据挖掘的理论和实际进展以及在不同前景领域的应用,如工业家、生物和社会网络。。 -
用可视化分析解决问题(Daniel Keim等人) 目的是概述 可视化分析 跨多个学科,并描述下一步必须采取的步骤,以培养强大的视觉分析社区,从而实现高级视觉分析应用程序的开发。 -
文档图像分析(Rangachar Kasturi) 本书描述了用于文本和图形图像文档处理的一些技术方法和系统。 -
应用R进行空间数据分析(Roger S.Bivand等人) 它介绍了处理空间数据的R包、函数、类和方法,并展示了更专业的空间数据分析,包括空间点模式分析、插值和地质统计学、区域数据分析和疾病制图。 -
使用R的机器学习的统计基础 本书旨在介绍机器学习的统计基础,旨在作为处理从数据中自动设计模型的学科。 所有的例子都是用统计编程语言R实现的。 -
元数据简介:第三版(Murtha Baca等人) 概述 元数据 -其类型、作用和特点; 讨论与网络资源相关的元数据; 对可用于出版和传播数字藏品的方法、工具、标准和协议的描述; -
描述数据模式:元数据标准的解构 它分析方法、技术、标准和语言来构造和描述数据的整体。 它揭示了这些方法的共同特征、隐藏的假设和普遍存在的模式,并显示了数据的实际结构和描述方式。 -
多关系数据挖掘(Arno Jan Knobbe) 本书探讨了数据挖掘的不同用途,并将结构化数据挖掘方法——多关系数据挖掘(MRDM)作为本书的主要主题。。 -
开放数据的全球影响:案例研究的主要发现 开放数据促进了经济创新、社会转型等。本书介绍了世界各地开放数据项目的详细案例研究,以及对哪些可行,哪些不可行的深入分析。