分层聚类

来自Citizendium
跳转到导航 跳转到搜索
这篇文章是一个存根,因此没有被批准。
主要文章
讨论
相关文章 [?]
参考文献 [?]
外部链接 [?]
可引用版本 [?]
 
此可编辑的主要文章是正在开发中并受免责声明.

分层聚类(也称为数字的 分类学)是的分支聚类分析[1]它将集群分层次地处理,即作为一组级别。层次结构的构建可以使用两种主要方法或其组合来执行:在聚合层次聚类(a自下而上方法),合并现有集群迭代地,而分裂层次聚类(a自上而下方法)从一个集群中的所有数据开始,然后迭代分割。在过程的每个步骤中距离相似性正在计算集群之间(聚合)或集群内(分裂),以确定如何拆分或合并。

可以使用几种不同的距离和相似性度量,这通常会导致不同的层次(尤其是对于仅基于本地信息的聚合层次),从而使其解释复杂化。尽管如此,层次聚类比平坦聚类,因此它在数据的多元分析中非常流行,例如基因蛋白质 序列.

参考文献和注释

  1. 层次聚类:聚类分析。
    • 聚类分析(也称为数据分割)有多种目标。所有这些目标都与将一组对象(也称为观察、个人、案例或数据行)分组或分割为子集或集群”,这样每个集群中的对象之间的关系比分配给不同集群的对象之间更密切。集群分析的所有目标的核心是被集群的各个对象之间的相似程度(或相异程度)的概念