×

数据科学中基于模型的聚类和分类。应用程序在R中。 (英语) Zbl 1436.62006年

剑桥统计与概率数学系列50.剑桥:剑桥大学出版社(ISBN 978-1-108-49420-5/hbk;978-1-108-164418-1/ebook)。十七、427页。(2019).
这本教科书以其众多的阐释性例子为基础。在给出严格的数学公式之前,它们用于解释所使用的聚类和分类模型。
本书的十个主要章节有以下标题:基于模型的聚类;处理困难;基于模型的分类;半监督聚类和分类;离散数据聚类;变量选择;高维数据;基于非高斯模型的聚类;网络数据;基于模型的协变量聚类。每章以参考书目注释结束。本书末尾列出了一份扩展的参考书目。
Publisher的描述:“聚类分析自动查找数据中的组。大多数方法都是启发式的,留下了一些中心问题,例如:有多少个集群?我应该使用哪种方法?我应该如何处理异常值?分类将新的观察结果分配给先前已分类的观察结果组,还存在关于参数调整、稳健性和不确定性评估的未决问题。本书根据统计模型对聚类分析和分类进行了框架,从而得出了原则性的估计、测试和预测方法,并对中心问题做出了合理的回答。它以易于理解但严格的方式构建基本思想,并提供大量数据示例和R代码;描述了高维数据和网络的现代方法;并解释了贝叶斯正则化、基于非高斯模型的聚类、聚类合并、变量选择、半监督和稳健分类、功能数据、文本和图像的聚类以及联合聚类等最新进展。为数据科学高级本科生以及研究人员和从业者撰写,它假设有多元微积分、线性代数、概率和统计学的基础知识。
大量使用真实世界的例子——数据、代码和彩色图形——建立直觉和理解;CRAN上提供的R包MBCbook允许复制分析;四位顶尖研究人员的最新报告提供了强大、最先进的方法。”

MSC公司:

62-02 与统计有关的研究展览(专著、调查文章)
62H30型 分类和区分;聚类分析(统计方面)
62兰特 大数据和数据科学的统计方面
PDF格式BibTeX公司 XML格式引用
全文: 内政部