岩石

ROCK:一种稳健的分类属性聚类算法。在数据挖掘中,聚类有助于发现底层数据中的分布模式。聚类算法通常采用基于距离度量(如欧几里德)的相似性度量来划分数据库,使得同一分区中的数据点比不同分区中的数据点更相似。本文研究了具有布尔属性和范畴属性的数据的聚类算法。我们发现,传统的聚类算法使用点之间的距离进行聚类,不适合布尔和范畴属性。相反,我们提出了一个新的链接概念来度量一对数据点之间的相似性/接近性。我们开发了一个鲁棒的分层聚类算法ROCK,它在合并簇时使用链接而不是距离。我们的方法自然地扩展到非度量相似性度量,在领域专家/相似性表是唯一的知识源的情况下是相关的。除了提供岩石的详细复杂性结果外,我们还利用真实生活和合成数据集进行了实验研究,以证明我们的技术的有效性。对于具有分类属性的数据,我们的研究结果表明ROCK不仅比传统算法生成质量更好的聚类,而且具有良好的可伸缩性。


zbMATH中的参考文献(参考文献69条)

显示第1到第20个结果,共69个。
按年份排序(引用)
  1. 伯里,马克;詹蒂利,米歇尔;施维格尔肖恩,克里斯;Sorella,Mara:度量有理集相似性上所有1中心问题的多项式时间逼近格式(2021)
  2. 于励勤;曹操、富源;赵兴旺;杨晓丹;Liang,Jiye:结合属性内容和标签信息进行分类数据集成聚类(2020)
  3. 德乌索,皮耶尔帕洛;Massari,Riccardo:混合数据的模糊聚类(2019)
  4. 乌格利奇,埃夫季尼;纳吉,伊万;多明尼卡,Vlčková:结合kappa统计和基于熵的测度比较集群(2019年)
  5. 布恩,托萨邦;Natthakan,Iam On:集群群:最近扩展和应用的方法调查(2018)
  6. 桑加姆,拉维·桑卡尔;Om,Hari:一种等偏(k)-聚类混合类型数据的原型算法(2018)
  7. 黄金龙;朱清生;杨丽君;郑东东;吴全旺:基于准聚类中心的新型聚类算法(2017)
  8. 休尔塔·穆尼奥斯,戴安娜·L。;Ríos Mercado,罗杰·Z。;Ruiz,Rubén:多属性市场分割问题的迭代贪婪启发式(2017)
  9. Kim,Kyongok:使用基于簇内和簇间杂质度量的新加权方法的加权(k)模式聚类(2017)
  10. 维格纳隆,V。;Chen,H.:稀疏不平衡数据聚类的多尺度序列化算法:在峰值排序中的应用(2016)
  11. 戴汉波;朱飞达;林奕鹏;Pang,HweeHwa:使用极端特征等级检测异常集合(2015)
  12. 哈立德,谢赫扎德;Razzaq,Shahid:TOBAE:基于密度的聚集聚类算法(2015)
  13. Noorbehbahani,法赫罗丁;穆萨维,赛耶德;距离增量聚类法(Abdolza,2015)ioport公司
  14. 康皮尔松;金,东吉尔;Cho,Sungzoon:评估用于柔性过程控制的虚拟计量结果的可靠性水平:基于新颖性检测的方法(2014)ioport公司
  15. 林,川武。;林春鸿;肖春元:基于GPU的并行可伸缩CAST聚类算法(2014)ioport公司
  16. 萨哈,因德拉吉特;基于分类的模糊聚类(基于分类的模糊聚类:2014)ioport公司
  17. 德恩扎,阿方索碘;Palumbo,Francesco:二进制数据的迭代因子聚类(2013)
  18. 卡罗尔,斯图蒂;Mangat,Veenu:基于粒子群优化的文本文档聚类方法评价(2013)ioport公司
  19. 西蒙,开尔文;戈帕克里希南,维韦卡南德;阿瑟,齐梅克;丛、高:增强子空间聚类研究综述(2013)
  20. 谭,京东;王汝静:平滑拼接:基于SNN的高维数据聚类方法(2013)ioport公司