×

挖掘不完善的数据。以R和Python为例。第二版。 (英语) Zbl 1459.62006号

工业数学(费城)4.宾夕法尼亚州费城:工业与应用数学学会(SIAM)(ISBN 978-1-61197-626-7/pbk;978-1-61197-627-4/ebook)。ix,481页。(2020).
正在审查的这本书是关于挖掘不完美数据的有趣而有用的书的第二版。第一版由Christina Diakaki审查(参见[Zbl 1079.62005号]).
章节标题为:1。什么是不完美的数据?;2.处理单变量异常值;3.处理多元异常值;4.处理时间序列异常值;5.处理缺失数据;6.处理其他数据异常;8.固定数据集的采样方案;9.什么是“好的”数据表征?;10.结束语和开放性问题;参考文献;索引。
从作者的序言中可以看出:“第二版《挖掘不完整数据》处理了第一版中未涵盖的一些主题,并扩展了对其中一些主题的处理。非常简单:
第一章是新的,首先提出了一个问题,“什么是不完美的数据?”,首先给出了“完美数据”的简单工作定义,然后描述了实际数据可以而且经常偏离这种理想状态的10种具体方式。此外,本章还讨论了这些缺陷的实际后果、它们的来源,以及数据类型和软件在理解和处理这些数据异常方面的作用。
第2章至第5章代表了对第一版中处理的主题的扩展覆盖,但被组织成更长、更集中的处理:单变量异常值、多变量异常值、时间序列异常值和缺失数据。
第6章专门讨论了其他数据异常,包括分类数据中的后检测器、堆积和粗化以及薄层,其中没有一个在第一版中讨论过,还有附带提到的内嵌。
第7、8和9章是对第一版第5、6和7章的轻微扩展。
与第一版一样,本书的最后一章(第10章)专门讨论了结论和开放性问题:毫不奇怪,这些结论和问题与第一版本末尾的结论和问题都大不相同。”

MSC公司:

62-02 与统计有关的研究展览(专著、调查文章)
62兰特 大数据和数据科学的统计方面
第60页 统计学在工程和工业中的应用;控制图
62-04 统计相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部