A.D.戈登。 分类。第2版。 (英语) Zbl 0929.62068号 统计学和应用概率专著82.佛罗里达州博卡拉顿:查普曼和霍尔/CRC(ISBN 1-5848-013-9)。ix,256页。(1999). 这本书提供了丰富的数学和工程工具,用于无监督学习(称为分类)。作者确定了分类过程的6个阶段,并就每个阶段以及广泛的书目细节提出了建议。这些阶段是:(一)数据集的选择;(ii)相关变量的选择;(iii)数据预处理;(iv)选择不同的衡量标准;(v) 选择聚类和图形程序进行分析;(vi)总结和验证结果。本书使用了pi.dcs.stand.ac.uk(pub/adg)上的六个数据集进行说明。第2章讨论了相似性和差异性的度量。给出了连续值、序数、标称和混合变量情况下计算距离/相异性的有用公式。第3章介绍了分区标准和算法。分区标准基于评估集群的异质性和隔离性。在这些划分算法中,有迭代重定位和数学规划。作者还提出了最小生成树(MST)、最大分割、混合分类和个体类识别(与拒绝决策模型相关)。提出了集群数量的问题,并列出了五个最成功的解决方案。绘制了统计最大似然(ML)模型的链接。第4章介绍了层次聚类。引入n树和值树来表示嵌套簇结构。介绍了直接优化算法和逐步优化凝聚算法。作者对聚类程序的选择提出了建议。第5章包含其他聚类过程:模糊、约束、重叠、概念聚类、符号数据聚类和分区划分。用低维空间中的一组点表示一组对象是第六章的主题。讨论的方法包括:主坐标、非度量多维缩放、交互式图和自组织图。作者引入了Biplot,它可以同时解释对象之间和变量之间的相似性。最后一章(第7章)解释了使用假设检验进行聚类验证的方法。对设计通过分析发现的簇的最终描述提出了建议。审核人:卢德米拉·昆切娃(班戈) 引用于89文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62-01 与统计有关的介绍性说明(教科书、辅导论文等) 62-02 与统计有关的研究展览(专著、调查文章) 91C20个 社会和行为科学中的集群 关键词:群集;分类;数据分析;相似性度量;分区;分层聚类;集群验证;图形表示法 PDF格式BibTeX公司 XML格式引用 \textit{A.D.Gordon},分类。佛罗里达州博卡拉顿第二版:查普曼和霍尔/CRC(1999;Zbl 0929.62068)