×

分类。第2版。 (英语) Zbl 0929.62068号

统计学和应用概率专著82.佛罗里达州博卡拉顿:查普曼和霍尔/CRC(ISBN 1-5848-013-9)。ix,256页。(1999).
这本书提供了丰富的数学和工程工具,用于无监督学习(称为分类)。作者确定了分类过程的6个阶段,并就每个阶段以及广泛的书目细节提出了建议。这些阶段是:(一)数据集的选择;(ii)相关变量的选择;(iii)数据预处理;(iv)选择不同的衡量标准;(v) 选择聚类和图形程序进行分析;(vi)总结和验证结果。本书使用了pi.dcs.stand.ac.uk(pub/adg)上的六个数据集进行说明。
第2章讨论了相似性和差异性的度量。给出了连续值、序数、标称和混合变量情况下计算距离/相异性的有用公式。第3章介绍了分区标准和算法。分区标准基于评估集群的异质性和隔离性。在这些划分算法中,有迭代重定位和数学规划。作者还提出了最小生成树(MST)、最大分割、混合分类和个体类识别(与拒绝决策模型相关)。提出了集群数量的问题,并列出了五个最成功的解决方案。绘制了统计最大似然(ML)模型的链接。第4章介绍了层次聚类。引入n树和值树来表示嵌套簇结构。介绍了直接优化算法和逐步优化凝聚算法。作者对聚类程序的选择提出了建议。第5章包含其他聚类过程:模糊、约束、重叠、概念聚类、符号数据聚类和分区划分。
用低维空间中的一组点表示一组对象是第六章的主题。讨论的方法包括:主坐标、非度量多维缩放、交互式图和自组织图。作者引入了Biplot,它可以同时解释对象之间和变量之间的相似性。最后一章(第7章)解释了使用假设检验进行聚类验证的方法。对设计通过分析发现的簇的最终描述提出了建议。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62-01 与统计有关的介绍性说明(教科书、辅导论文等)
62-02 与统计有关的研究展览(专著、调查文章)
91C20个 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用