酷猫

COOLCAT:一种基于熵的分类聚类算法。本文探讨了分类数据聚类与熵的关系:相似poi的聚类比不同poi的聚类熵低。我们使用这个连接来设计一个增量启发式算法COOLCAT,它能够有效地聚类具有类别属性的大数据集记录和数据流。与过去发表的其他分类聚类算法相比,COOLCAT的聚类结果对于不同的样本大小和参数设置非常稳定。此外,聚类的标准是非常直观的,因为它深深地植根于众所周知的熵概念。最重要的是,COOLCAT能够很好地处理数据流(连续到达的数据点流)的聚类,因为它是一种增量算法,能够聚类新的点,而不必查看迄今为止已聚集的每个点。通过对真实数据集和合成数据集的一系列实验,我们证明了COOLCAT的效率和可伸缩性。


zbMATH中的参考文献(参考文献29条)

显示第1到第20个结果,共29个。
按年份排序(引用)
  1. 甘国军;马朝群;吴建红:数据聚类。理论、算法和应用(2021)
  2. 李琴、李玉;曹操、富源;赵兴旺;杨晓丹;Liang,Jiye:结合属性内容和标签信息进行分类数据集成聚类(2020)
  3. Śmieja,马雷克;哈伊托,克孜什托夫;Tabor,Jacek:稀疏高维二进制数据聚类的有效混合模型(2019)
  4. 高学东;杨明汉:对分类数据内部聚类验证指标的理解与增强(2018)
  5. 桑加姆,拉维·桑卡尔;Om,Hari:一种等偏(k)-聚类混合类型数据的原型算法(2018)
  6. 赵兴旺;曹操、富源;Liang,Jiye:混合数据序列集成簇生成算法(2018)
  7. Kim,Kyongok:使用基于簇内和簇间杂质度量的新加权方法的加权(k)模式聚类(2017)
  8. 蒋、冯;刘国柱;杜俊伟;Sui,Yuefei:使用离群点检测技术初始化(K)-模式聚类(2016)
  9. 大的,唱的;哈雷尔,奥弗;科达斯,卡塔兹纳;Dey,Dipak K.:基于熵准则的不完全数据的潜在类分析(2016)
  10. 白、梁;梁继业:范畴数据的聚类有效性函数:解空间视角(2015)
  11. 李,叶锋;乐,嘉进;Wang,Mei:用优化的凝聚方法提高CLOPE的利润价值和稳定性(2015)
  12. 张耀明;贾洪:基于统一相似性度量的分类和数值属性数据聚类(2013)
  13. 大卫,吉尔;Averbuch,Amir:SpectralCAT:数值和名义数据的分类光谱聚类(2012)
  14. 梁继业;赵兴旺;李德玉;曹操、富源;党创银:利用混合数据的信息熵确定聚类数(2012)
  15. 刘清宝;董国柱:基于对比度模式的分类数据聚类质量指数(2012)ioport公司
  16. 熊腾科;王胜瑞;梅耶斯,安德烈;Monga,Ernest:DHCC:分类数据的分层次聚类(2012)
  17. 白、梁;梁继业;党、创银;曹福源:一种新的高维分类数据聚类属性加权算法(2011)
  18. 布劳尔,罗伊洛夫K。;Groenwold,Albert:带粒子群优化的序值属性的修正模糊c-均值(2010)ioport公司
  19. 燕华;陈可克;刘玲;Yi,Zhang:一个可伸缩的框架,用于高效地集群事务性数据(2010)ioport公司
  20. 陈可克;Liu,Ling:HE-Tree:用于检测分类数据流聚类结构变化的框架(2009)ioport公司