genieclust:带噪声点的快速鲁棒层次聚类检测
对Genie算法的重述(加戈列夫斯基,2021年<doi:10.1016/j.softx.2021.100722>)-稳健层次聚类法(Gagolewski,Bartoszuk,Cena,2016年)<doi:10.1016/j.ins.2016.05.003>)。现在更快、更节省内存;确定整个层次结构对于低维欧氏空间中10M点的数据集,或高维的100K点只需要1-2分钟。允许根据相互可达性距离进行聚类从而它可以充当噪声点检测器或“HDBSCAN*”(能够检测预定义数量的集群,因此它不依赖于易碎的“eps”参数)。该软件包还提供了不平等指数的实现(基尼、邦费罗尼指数)、外部聚类有效性测度(例如,归一化聚类精度和分区相似性得分如调整后的Rand、Fowlkes-Mallows、调整后的相互信息、,和成对设置索引),和内部聚类有效性指数(例如Calinski-Harabasz,Davies-Bouldin、Ball-Hall、Silhouette和广义Dunn指数)。另请参阅“PyPI”上提供的“genieclust”的“Python”版本,其中支持稀疏数据、更多指标,甚至更大的数据集。
文档:
下载内容:
反向依赖关系:
链接:
请使用规范形式https://CRAN.R-project.org/package=genieclust链接到此页面。