×

集群集成选择的社会网络优化。 (英语) Zbl 1497.68445号

摘要:本文研究了无监督学习中的聚类集成选择问题。考虑到集群解决方案的大规模集成,我们的目标是选择解决方案的子集,形成一个比使用所有可用解决方案更小但性能更好的集群集成。聚合所选解决方案的常见方法是将所选结果的信息累积到相似矩阵中。本文建议将相似矩阵转换为模块化矩阵,然后应用新的一致性函数来优化其中的模块化度量。我们将模块化最大化问题表示为一个0-1二次规划,它可以精确地求解小数据集。我们还建立了一种新的贪心算法,即和链接,用于在很短的时间内优化大规模数据集的目标函数。我们表明,提出的一致性划分比直接应用普通聚类集成方法得到的划分更接近实际的聚类结构。与其他最常引用的一致性函数相比,该方法具有很好的效率。

MSC公司:

68T05年 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
91第30页 社交网络;意见动态
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿拉斯加州贾恩。数据聚类:超过K-means 50年。模式识别。莱特。,2010.31(8):651-666. doi:10.1016/j.parec.2009.011。统一资源定位地址https://doi.org/10.1016/j.patrec.2009.09.011。
[2] Alizadeh H,Minaei-Bidgoli B,Parvin H。字符串表示中模糊聚类集成的优化。Int.J.模式识别。Artif公司。智力。,2013.27(2). doi:10.1142/S02180141350055。URLhttps://doi.org/10.1142/S02180141350055·Zbl 1267.62076号
[3] Strehl A,Ghosh J.集群集成——用于组合多个分区的知识重用框架。J.马赫。学习。研究,2002.3:583-617。统一资源定位地址http://jmlr.org/papers/v3/strehl02a.html。 ·Zbl 1084.68759号
[4] Alizadeh H,Minaei-Bidgoli B,Parvin H。基于新簇稳定性测度的簇系综选择。智力。数据分析。,2014.18(3):389-408. doi:10.3233/IDA-140647。统一资源定位地址https://doi.org/10.3233/IDA-140647。
[5] Fern XZ,Lin W.集群合奏选择。统计分析与数据挖掘,2008.1(3):128-141。doi:10.1002/sam.10008。统一资源定位地址https://doi.org/10.1002/sam.10008。
[6] 阿齐米J,弗恩XZ。自适应集群集成选择。收录于:Boutiler C(编辑),2009年国际人工智能学会,第21届国际人工智能联合会议记录,美国加利福尼亚州帕萨迪纳,2009年7月11日至17日。2009年,第992-997页。统一资源定位地址http://ijcai.org/Processings/09/Papers/168.pdf。
[7] Abbasi S、Nejatian S、Parvin H、Rezaie V、Bagherifard K。考虑质量和多样性的聚类集成选择。Artif公司。智力。版本,2019.52(2):1311-1340。doi:10.1007/s10462-018-9642-2。统一资源定位地址https://doi.org/10.1007/s10462-018-9642-2。
[8] Alizadeh H,Minaei-Bidgoli B,Parvin H。通过选择基本簇的子集来提高簇集合的质量。J.实验理论。Artif公司。智力。,2014.26(1):127-150. doi:10.1080/0952813X.2013.813974。统一资源定位地址https://doi.org/10.1080/0952813X.2013.813974。
[9] Agarwal G,Kempe D.模块化——通过数学规划最大化图形社区。凝聚物质物理学,2007.66。doi:10.1140/epjb/e2008-00425-1·Zbl 1188.90262号
[10] 纽曼MEJ。社区、模块和网络中的大规模结构,2012年。
[11] 图中的Fortunato S.社区检测。CoRR,2009.abs/0906.0612.0906.0612,网址:http://arxiv.org/abs/0906.0612。
[12] Fred ALN,Jain阿拉斯加州。使用证据积累组合多个聚类。IEEE传输。模式分析。机器。智力。,2005.27(6):835-850。doi:10.1109/TPAMI.2005.113。统一资源定位地址https://doi.org/10。1109/TPAMI.2005.113。
[13] Caruana R、Niculescu-Mizil A、Crew G、Ksikes A.从模型库中选择合奏。摘自:Brodley CE(编辑),《机器学习》,《第二十届国际会议论文集》(ICML 2004),加拿大阿尔伯塔省班夫,2004年7月4日至8日,ACM国际会议论文系列第69卷。美国医学会,2004年,doi:10.1145/1015330.1015432。统一资源定位地址https://doi.org/10.1145/1015330.1015432。
[14] Hadjitodorov ST、Kuncheva LI、Todorova LP。适度的多样性可实现更好的集群群。信息融合,2006.7(3):264-275。doi:10.1016/j.inffus.2005.01.008。统一资源定位地址https://doi.org/10.1016/j.inffus。 2005.01.008.
[15] Parvin H,Minaei-Bidgoli B.基于加权集群精英选择的集群集成框架。高级数据分析。分类。,2013.7(2):181-208.doi:10.1007/s11634-013-0130-x.URLhttps://doi.org/10.1007/s11634-013-0130-x。 ·Zbl 1267.62076号
[16] Singh V,Mukherjee L,Peng J,Xu J.使用半定规划的集成聚类及其应用。机器。学习。,2010.79(1-2):177-200. doi:10.1007/s10994-009-5158-y.URLhttps://doi.org/10.1007/s10994-09-5158-y·Zbl 1470.62096号
[17] Rao PR,达科斯塔JPP。一致性聚类算法的性能研究和划分图的特性。2010年IEEE国际计算智能与计算研究会议。2010年,第1-5页。
[18] Gu´enoche A.分割共识:一种建设性方法。高级数据分析。分类。,2011.5(3):215- 229. doi:10.1007/s11634-011-0087-6。统一资源定位地址https://doi.org/10.1007/s11634-011-0087-6。 ·Zbl 1253.68258号
[19] Christou IT。通过精确方法协调集群集成。IEEE传输。模式分析。机器。智力。,2011.33(2):279-293. doi:10.10109/TPAMI.2010.85。统一资源定位地址https://doi.org/10.1109/TPAMI。2010年8月5日。
[20] Vega-Pons S,Ruiz-Shulcloper J.聚类集成算法综述。国际J模式识别。Artif公司。智力。,2011年25月(3):337-372。doi:10.1142/S021801411008683。统一资源定位地址https://doi.org/10。1142/S021801411008683。
[21] Brandes U、Delling D、Gaertler M、G¨orke R、Hoefer M、Nikoloski Z、Wagner D。关于模块化集群。IEEE Trans。知识。数据工程,2008.20(2):172-188。doi:10.1109/TKDE.2007.190689。URLhttps://doi.org/10.109/TKDE.2007.190689。
[22] Zhang X,Wang R,Wang Y,Wang J,Qiu Y,WangL,Chen L.复杂网络社区检测中的模块化优化。欧洲物理快报,2009.87:38002。doi:10.1209/0295-5075/87/38002。
[23] Zhang X,Li Z,Wang R,Wang Y.复杂网络中全局搜索社区结构的组合模型和算法。J.库姆。最佳。,2012.23(4):425-442. doi:10.1007/s10878-010-9356-0。统一资源定位地址https://doi.org/10.1007/s10878-010-9356-0。 ·Zbl 1245.90013号
[24] Lancichinetti A,Fortunato S.《复杂网络中的共识聚类》。CoRR,2012.abs/203.6093。1203.6093,网址http://arxiv.org/abs/203.6093。
[25] Gambette P,Gu´enoche A.图分区的Bootstrap聚类。RAIRO——运营研究,2011.45(4):339-352。doi:10.1051/ro/2012001。统一资源定位地址https://doi.org/10.1051/ro/2012001。 ·Zbl 1238.05116号
[26] Hosseinzadeh R、Alizadeh H、Nazemi E.《社交网络中的社区检测集成》。在:第11届伊朗智能系统会议(ICIS13),德黑兰。2013年,第27-35页。
[27] Newman MEJ,Girvan M.发现和评估网络中的社区结构。物理学。E版,2004.69(2):026113。doi:10.1103/PhysRevE.69.026113。统一资源定位地址http://link.aps.org/doi/10.10103/物理修订版E.69.026113。
[28] JN布雷肯里奇。复制聚类分析:方法、一致性和有效性。多元行为研究,1989.24(2):147-161。doi:10.1207/s15327906mbr2402\1。PMID:26755276,https://doi.org/10.10207/s15327906mbr2402_1,网址https://doi.org/10.10207/s15327906mbr2402_1。
[29] Roth V,Lange T,Braun ML,Buhmann JM。聚类验证的重新采样方法。收录于:H¨ardle WK,R¨onz B(eds.),COMPSTAT 2002,《计算统计学报》,第15届研讨会,德国柏林,2002年8月24-28日。斯普林格,2002年,第123-128页。doi:10.1007/978-3642-57489-4\13。统一资源定位地址https://doi.org/10.1007/978-3-642-57489-4_13。 ·Zbl 1439.62034号
[30] Roth V,Lange T.聚类问题中的特征选择。发表于:Thrun S、Saul LK、Sch¨olkopf B(eds.),《神经信息处理系统的进展》16【神经信息处理体系,NIPS 2003年12月8日至13日,加拿大不列颠哥伦比亚省温哥华和惠斯勒】。麻省理工学院出版社,2003年,第473-480页。统一资源定位地址http://papers.nips.cc/paper/2486-feature-selection-in-clustering-problems。
[31] Pascual D、Pla F、S´anchez JS。使用信息稳定性度量进行集群验证。模式识别。莱特。,2010.31(6):454-461. doi:10.1016/j.patrec.2009.07.009。统一资源定位地址https://doi.org/10.1016/j。patrec.2009.07.009。
[32] Law MHC、Topchy AP、Jain AK。多目标数据聚类。2004年IEEE计算机学会计算机视觉和模式识别会议(CVPR 2004),附光盘,2004年6月27日至7月2日,美国华盛顿特区。IEEE计算机协会,2004年,第424-430页。doi:10.1109/CVPR.2004.170。统一资源定位地址http://doi.ieecomputersociety.org/10.109/CVPR.2004.170。
[33] 吉梅拉·R,阿马拉局域网。复杂代谢网络的功能制图。《自然》,2005年。433(7028):895-900. 统一资源定位地址http://dx.doi.org/10.1038/nature03288。
[34] 克劳塞特A、纽曼M、摩尔C。在非常大的网络中寻找社区结构。身体检查。E、 统计、非线性和软物质物理学,2004.70 6 Pt 2:066111。
[35] 纽曼ME。网络中的模块化和社区结构。美国国家科学院院刊,2006年。103(23):8577-8582. doi:10.1073/pnas.0601602103。统一资源定位地址http://www.ncbi.nlm.nih.gov/sites网站/恩特拉兹?cmd=retrieve&db=pubmed&list_uids=16723398&dopt=AbstractPlus。
[36] Ahn YY、Bagrow J、Jørgensen S.Link社区揭示了网络中的多尺度复杂性。《自然》,2010.466(7307):761-764。doi:10.1038/nature09182。
[37] Li S,Chen Y,Du H,Feldman MW。用于改进社区结构检测的带有局部搜索策略的遗传算法。复杂性,2010.15(4):53-60。doi:10.1002/cplx.20300。统一资源定位地址https://doi。org/10.1002/cplx.20300。
[38] 纽曼MEJ。检测网络中社区结构的快速算法。物理学。E版,2004.69:066133。doi:10.1103/PhysRevE.69.066133。统一资源定位地址https://link.aps.org/doi/10.10103/物理版E.69.066133。
[39] Mojarad M,Parvin H,Nejatian S,Rezaie V.基于簇聚类和基簇迭代融合的一致性函数。国际期刊不确定性。模糊知识。基于系统。,2019.27(1):97-120. doi:10.1142/S0218488519500053。统一资源定位地址https://doi.org/10.1142/S0218488519500053。
[40] Tan P,Steinbach MS,Kumar V.数据挖掘简介。Addison-Wesley,2005年。国际标准图书编号0-321-321367。统一资源定位地址http://www-users.cs.umn.edu/%7Ekumar/dmbook/。
[41] Mojarad M,Nejatian S,Parvin H,Mohammadpoor M。基于簇聚类和基簇迭代融合的模糊聚类集成。申请。智力。,2019.49(7):2567-2581. doi:10.1007/s10489-018-01397-x.网址https://doi.org/10.1007/s10489-018-01397-x。
[42] Iam-on N、Boongoen T、Garrett SM、Price CJ。基于链路的集群集成问题研究。IEEE传输。模式分析。机器。智力。,2011.33(12):2396-2409. doi:10.1109/TPAMI.2011.84。统一资源定位地址https://doi.org/10.109/TPAMI.2011.84。
[43] 周Z,唐W。集群合奏。知识。基于系统。,2006.19(1):77-83. doi:10.1016/j.knosys.2005。11.003. 统一资源定位地址https://doi.org/10.1016/j.knosys.2005.11.003。
[44] Topchy AP、Jain AK、Punch WF。集群集合:共识和弱分割模型。IEEE传输。模式分析。机器。智力。,2005.27(12):1866-1881. doi:10.1109/TPAMI.2005.237。统一资源定位地址https://doi.org/10.1109/TPAMI.2005.237。
[45] Nguyen N,Caruana R.共识聚类。在:《第七届IEEE国际数据挖掘会议论文集》(ICDM 2007),2007年10月28日至31日,美国内布拉斯加州奥马哈。IEEE计算机学会,2007年第607-612页。doi:10.1109/ICDM.2007.73。统一资源定位地址https://doi.org/10.109/ICDM.2007.73。
[46] Minaei Bidgoli B,Parvin H,Alinejad Rokny H,Alizadeh H,Punch WF。重新采样方法和自适应对聚类综合效果的影响。Artif公司。智力。版本,2014.41(1):27-48。doi:10.1007/s10462-011-9295-x.网址https://doi.org/10.1007/s10462-011-9295-x。
[47] 膳食TG。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。