古蒂雷斯·托斯卡诺(Guttiérrez Toscano),P。;F.H.C.万豪酒店。 化学化合物的无监督分类。 (英语) Zbl 0923.62107号 J.R.Stat.Soc.,塞尔维亚。C、 申请。统计。 48,第2期,153-163(1999). 摘要:结构相似的簇合化合物在医药工业中很重要。描述结构的一种方法是化学“指纹”。指纹是一串二进制数字,典型的数据集由大量指纹组成;一个合适的聚类过程必须考虑到这种编码方法的特性,并且必须能够处理大型数据集。本文描述了一组指纹数据的分析。该分析基于从指纹中导出的适当距离度量,然后将度量缩放到低维空间。研究了一种适用于超大数据集的度量缩放近似。使用两个程序进行聚类分析,麦克卢斯特和AutoClass-C,对缩放数据进行。 MSC公司: 62N99型 生存分析和审查数据 62H30型 分类和区分;聚类分析(统计方面) 62页99 统计学的应用 92C40型 生物化学、分子生物学 92E10型 分子结构(图形理论方法、微分拓扑方法等) 关键词:化学指纹;聚类分析;兰德指数;公制缩放 软件:麦克卢斯特 PDF格式BibTeX公司 XML格式引用 \textit{P.Guttiérrez Toscano}和\textit{F.H.C.Marriott},J.R.Stat.Soc.,Ser。C、 申请。Stat.48,No.2,153--163(1999;Zbl 0923.62107) 全文: 内政部