×

聚类中的特征选择框架。 (英语) Zbl 1392.62194号

摘要:我们考虑使用潜在的大量特征集对观测值进行聚类的问题。人们可能会认为,数据中存在的真正的潜在聚类只与一小部分特征有关,如果使用完整的特征集对观测值进行聚类,则会遗漏。我们提出了一种新的稀疏聚类框架,其中一种使用自适应选择的特征子集对观测值进行聚类。该方法使用套索类型惩罚来选择特征。我们使用这个框架开发了稀疏(K)均值和稀疏层次聚类的简单方法。单一标准控制特征的选择和生成的聚类。这些方法在模拟数据和基因组数据上进行了验证。

理学硕士:

62H30型 分类和区分;聚类分析(统计方面)
62J07型 岭回归;收缩估计器(拉索)
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

预防卒中
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接