×

化学化合物的无监督分类。 (英语) Zbl 0923.62107号

摘要:结构相似的簇合化合物在医药工业中很重要。描述结构的一种方法是化学“指纹”。指纹是一串二进制数字,典型的数据集由大量指纹组成;一个合适的聚类过程必须考虑到这种编码方法的特性,并且必须能够处理大型数据集。本文描述了一组指纹数据的分析。该分析基于从指纹中导出的适当距离度量,然后将度量缩放到低维空间。研究了一种适用于超大数据集的度量缩放近似。使用两个程序进行聚类分析,麦克卢斯特和AutoClass-C,对缩放数据进行。

MSC公司:

62N99型 生存分析和审查数据
62H30型 分类和区分;聚类分析(统计方面)
62页99 统计学的应用
92C40型 生物化学、分子生物学
92E10型 分子结构(图形理论方法、微分拓扑方法等)

软件:

麦克卢斯特
PDF格式BibTeX公司 XML格式引用
全文: 内政部