丹妮拉·维滕(Daniela M.Witten)。;罗伯特·提比拉尼 聚类中的特征选择框架。 (英语) Zbl 1392.62194号 美国统计协会。 105,编号490,713-726(2010). 摘要:我们考虑使用潜在的大量特征集对观测值进行聚类的问题。人们可能会认为,数据中存在的真正的潜在聚类只与一小部分特征有关,如果使用完整的特征集对观测值进行聚类,则会遗漏。我们提出了一种新的稀疏聚类框架,其中一种使用自适应选择的特征子集对观测值进行聚类。该方法使用套索类型惩罚来选择特征。我们使用这个框架开发了稀疏(K)均值和稀疏层次聚类的简单方法。单一标准控制特征的选择和生成的聚类。这些方法在模拟数据和基因组数据上进行了验证。 引用于2评论引用于83文件 理学硕士: 62H30型 分类和区分;聚类分析(统计方面) 62J07型 岭回归;收缩估计器(拉索) 62页第10页 统计学在生物学和医学中的应用;元分析 关键词:层次聚类;高维的;K-means聚类;拉索;型号选择;稀疏;无监督学习 软件:预防卒中 PDF格式BibTeX公司 XML格式引用 \textit{D.M.Witten}和\textit{R.Tibshirani},J.Am.Stat.Assoc.105,No.490,713--726(2010;Zbl 1392.62194) 全文: 内政部 链接