拉斐尔·艾里扎里。 数据科学导论。使用R的数据分析和预测算法。 (英语) Zbl 1427.68005号 查普曼和霍尔/CRC数据科学系列佛罗里达州博卡拉顿:CRC出版社(ISBN 978-0-367-35798-6/hbk;978-0-429-34183-0/电子书)。xxix,713页。(2020). 出版商的描述:数据科学导论:带R的数据分析和预测算法介绍了可以帮助您应对现实世界数据分析挑战的概念和技能。它涵盖了概率、统计推断、线性回归和机器学习等概念。它还可以帮助您开发诸如R编程、数据争论、数据可视化、预测算法构建、使用UNIX/Linuxshell组织文件、使用Git和GitHub进行版本控制以及可复制文档准备等技能。这本书是数据科学第一门课程的教科书。虽然一些编程经验可能会有所帮助,但之前不需要了解R。本书分为六个部分:R、数据可视化、R统计、数据争论、机器学习和生产力工具。每一部分都有几个章节,旨在作为一个讲座进行介绍。作者使用了激励性的案例研究,真实地模拟了数据科学家的经验。他首先提出具体的问题,然后通过数据分析来回答这些问题,从而学习概念作为回答问题的手段。案例研究的例子包括:美国各州谋杀率、自我报告的学生身高、世界卫生和经济趋势、疫苗对传染病发病率的影响、2007-2008年的金融危机、选举预测、组建棒球队、手写数字的图像处理以及电影推荐系统。本文仅简要介绍了用于回答案例研究问题的统计概念,因此强烈建议使用概率和统计教科书作为补充,以深入理解这些概念。如果你阅读并理解了这些章节并完成了练习,你将准备学习成为专家所需的更高级概念和技能。 引用于1审查引用于1文件 MSC公司: 68-01 与计算机科学相关的介绍性说明(教科书、教程论文等) 62-01 与统计有关的介绍性说明(教科书、辅导论文等) 62兰特 大数据和数据科学的统计方面 68T09号 数据分析和大数据的计算方面 软件:预订;阅读器;易怒的;潮韵诗;rmarkdown公司;R工作室;字符串;第三年;矩阵统计;呜呜声;对于猫;地图;数字实验室;针织物;质量(R);dplyr公司;ggplot2;对 PDF格式BibTeX公司 XML格式引用 \textit{R.A.Irizarry},数据科学导论。佛罗里达州R.Boca Raton的数据分析和预测算法:CRC出版社(2020;Zbl 1427.68005) 全文: 内政部