×

DILS:通过双重迭代局部搜索进行约束聚类。 (英语) Zbl 1458.68202号

摘要:聚类一直是知识发现的强大工具。它传统上是无监督的,最近受到了新的关注,因为它已经证明,当提供新类型的信息时,可以产生更好的结果,从而导致了一种新的半监督学习:约束聚类。该技术是传统聚类的推广,它考虑了由约束编码的附加信息。约束可以以实例级必须链接和不能链接约束的形式给出,这是本文的重点。我们提出了一种新的元启发式算法,即对偶迭代局部搜索,并证明了其对约束聚类问题产生高质量结果的能力。我们将该建议获得的结果与最新算法在25个数据集上获得的结果进行了比较,这些数据集具有增量的基于约束的信息,并借助贝叶斯统计测试支持我们的结论。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
60华氏30 随机分析的应用(PDE等)
68T05型 人工智能中的学习和自适应系统
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安托万,V。;Quost,B。;马森,M.-H。;Denoeux,T.,CECM:约束证据c-均值算法,计算机。统计数据分析。,第56页,第4页,第894-914页(2012年)·兹比尔1243.62086
[2] Archetti,C。;费利特,D。;莫尔,A。;Speranza,M.G.,发布日期和完成时间最小化的旅行推销员问题的迭代局部搜索,计算。操作。决议,98,24-37(2018)·Zbl 1391.90646号
[3] Avci,M。;Topaloglu,S.,广义二次多重背包问题的多部分迭代局部搜索算法,计算。操作。决议,83,54-65(2017)·Zbl 1458.90534号
[4] Ayed,S.B。;Elouedi,Z。;Lefevre,E.,CEVM:CBR系统的受限证据词汇维护政策,应用智能系统的工业、工程和其他应用国际会议,579-592(2019),施普林格
[5] Bean,J.C.,《用于排序和优化的遗传算法和随机键》,ORSA J.Compute。,6, 2, 154-160 (1994) ·Zbl 0807.90060号
[6] Benavoli,A。;Corani,G。;德姆沙尔,J。;Zaffalon,M.,《改变的时间:通过贝叶斯分析比较多个分类器的教程》,J.Mach。学习。第18号、第1号、第2653-2688号决议(2017年)·Zbl 1440.62237号
[7] 布拉德利,P.S。;Bennett,K.P。;Demiriz,A.,《约束K-Means聚类》,技术报告(2000),MSR-TR-2000-65,微软研究院
[8] Brieden,A。;Gritzmann,P。;Klemm,F.,《通过图表的约束聚类:统一理论及其在选区设计中的应用》,欧洲期刊Oper。第263、1、18-34号决议(2017年)·Zbl 1380.91072号
[9] 卡拉斯科,J。;南卡罗来纳州加西亚。;del Mar Rueda,M。;Herrera,F.,rNPBST:涵盖非参数和贝叶斯统计测试的R包,混合人工智能系统国际会议,281-292(2017),Springer
[10] 沙佩尔,O。;Schlkopf,B。;Zien,A.,《半监督学习》(2010),麻省理工学院出版社
[11] Chaves,A.A。;Gonçalves,J.F。;Lorena,L.A.N.,针对容量受限的中心聚类问题的带局部搜索的自适应偏置随机密钥遗传算法,计算。工业工程,124,331-346(2018)
[12] Chentli,H。;瓦菲,R。;Cherif Khettaf,W.R.,迭代局部搜索启发式杂交对车辆路线问题的影响:对有能力盈利旅游问题的应用,国际运筹学与企业系统会议,80-101(2018),施普林格
[13] 戴维森,I。;Basu,S.,具有实例级约束的集群调查,ACM Trans。知识。发现。数据,1,1-41(2007)
[14] 戴维森,I。;Ravi,S.,《带约束的聚类:可行性问题和k-means算法》,2005年数据挖掘国际会议论文集,138-149(2005),SIAM
[15] 埃斯特拉达·莫雷诺,A。;Savelsbergh,M。;Juan,A.A。;Panadero,J.,Biased-随机迭代局部搜索,用于多周期车辆路径问题,具有交货灵活性价格折扣,国际贸易。操作。第26、4、1293-1314号决议(2019年)·Zbl 07766351号
[16] Gendreau,M。;Potvin,J.-Y.,《元启发式手册》(2010),Springer Publishing Company,Incorporated·Zbl 1198.90002号
[17] Gonçalves,J.F。;Resende,M.G.,用于组合优化的有偏随机关键遗传算法,《启发式》,17,5,487-525(2011)
[18] 赫鲁晓卡,E.R。;坎佩罗,R.J。;Freitas,A.A.,《聚类进化算法综述》,IEEE Trans。系统。人类网络。C部分,39,2,133-155(2009)
[19] 休伯特,L。;Arabie,P.,比较分区,J.Classif。,2, 1, 193-218 (1985)
[20] Jain,A.K。;Murty,M.N。;Flynn,P.J.,《数据聚类:综述》,ACM Compute。Surv公司。(CSUR),31,3,264-323(1999)
[21] José-García,a。;Gómez-Flores,W.,《使用自然启发元启发式的自动聚类:一项调查》,Appl。软计算。,41, 192-213 (2016)
[22] Kamvar,K。;塞潘达尔,S。;Klein,K。;丹·D。;曼宁,M。;Christopher,C.,光谱学习,国际人工智能联合会议(2003),斯坦福信息实验室
[23] Khashabi,D.,Wieting,J.,Liu,J.Y.,Liang,F.,2015年。附带信息的聚类:从概率模型到确定性算法。arXiv:1508.06235。
[24] 法律,M.H。;Topchy,A。;Jain,A.K.,带软约束和组约束的聚类,IAPR模式识别(SPR)和结构与句法模式识别(SSPR)统计技术联合国际研讨会,662-670(2004),Springer·兹比尔1104.68639
[25] Lourenço,H.R。;O.C.马丁。;Stützle,T.,迭代局部搜索:框架和应用,元启发式手册,363-397(2010),施普林格
[26] 麦,S.T。;阿米尔·叶海亚,S。;Bailly,S。;佩平,J.-L。;乔阿克里亚(Chouakria,A.D.)。;Nguyen,K.T。;Nguyen,A.-D.,《阻塞性睡眠呼吸暂停综合征分析的进化主动约束聚类》,《数据科学》。工程师,3,4,359-378(2018)
[27] 马森,M.-H。;Denoeux,T.,ECM:模糊c均值算法的证据版本,模式识别。,41, 4, 1384-1397 (2008) ·Zbl 1131.68081号
[28] Matake,N。;Hiroyasu,T。;米奇,M。;Senda,T.,大规模数据的多目标聚类与自动k确定,第九届遗传与进化计算年会论文集,861-868(2007)
[29] 南达·S·J。;Panda,G.,《关于自然启发的分区聚类元启发式算法的调查》,Swarm Evol。计算。,16, 1-18 (2014)
[30] de Oliveira,R.M。;Chaves,A.A。;Lorena,L.A.N.,约束聚类问题的两种混合方法的比较,应用。软计算。,54, 256-266 (2017)
[31] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A。;米歇尔,V。;蒂里昂,B。;O.格栅。;布隆德尔,M。;普雷滕霍弗,P。;韦斯,R。;杜堡,V。;范德普拉斯,J。;帕索斯,A。;Cournapeau博士。;布鲁彻,M。;佩罗,M。;Duchesnay,E.,Scikit-learn:Python中的机器学习,J.Mach。学习。第12号决议,2825-2830(2011年)·Zbl 1280.68189号
[32] 佩利格,D。;Baras,D.,K-means with large and noise constraint set,European Conference on Machine Learning,674-682(2007),施普林格出版社
[33] Rand,W.M.,《聚类方法评估的客观标准》,美国统计协会,66,336,846-850(1971)
[34] 鲁伊斯,C。;Spiliopoulou,M。;Menasalvas,E.,C-DBSCAN:基于密度的约束聚类,粗糙集、模糊集、数据挖掘和粒度软件计算国际研讨会,216-223(2007),Springer
[35] Saidi,F。;特拉贝尔西,Z。;Ghazela,H.B.,基于受限证据聚类的恐怖分子亚社区检测新方法,2018年第12届信息科学研究挑战国际会议,1-8(2018),IEEE
[36] 施密特,J。;布兰德尔,E.M。;Kramer,S.,《具有属性级约束的聚类》,2011年IEEE第11届国际数据挖掘会议,1206-1211(2011),IEEE
[37] 塞姆纳尼,S.H。;O.A.巴斯尔。;Van Beek,P.,机动目标环境中基于群集跟踪的约束聚类,Rob。自动。系统。,83, 243-250 (2016)
[38] 塞雷特,A。;Verbraken,T。;Baesens,B.,《一种新的基于知识的约束聚类方法:直接营销中的理论和应用》,应用。软计算。,24, 316-327 (2014)
[39] 斯皮尔斯,W.M。;De Jong,K.D.,《关于参数化均匀交叉的优点》,技术报告(1995年),华盛顿海军研究实验室
[40] Triguero,I。;南卡罗来纳州加西亚。;Herrera,F.,《半监督学习的自我标记技术:分类法、软件和实证研究》,Knowl。信息系统。,42, 2, 245-284 (2015)
[41] Triguero,I。;González,S。;莫亚诺,J.M。;南卡罗来纳州加西亚。;Alcalá-Fdez,J。;Luengo,J。;费尔南德斯,A。;del Jesús,M.J。;桑切斯,L。;Herrera,F.,KEEL 3.0:数据挖掘中用于多阶段分析的开源软件,国际计算杂志。智力。系统。,10, 1, 1238-1249 (2017)
[42] Wagstaff,K。;Cardie,C。;罗杰斯,S。;Schrödl,S.,带背景知识的约束k-means聚类,第十八届机器学习国际会议论文集,577-584(2001),Morgan Kaufmann Publishers Inc。
[43] Wang,J。;Wu,S。;Li,G.,《使用实例和属性级边信息进行聚类》,《国际计算杂志》。智力。系统。,3, 6, 770-785 (2010)
[44] Wu,H。;Prasad,S.,使用伪标签进行高光谱图像分类的半监督深度学习,IEEE Trans。图像处理。,27, 3, 1259-1270 (2017) ·Zbl 1409.94663号
[45] 赵,F。;何,X。;Yang,G。;马伟(Ma,W.)。;张,C。;Song,H.,一种具有自适应扰动机制的混合迭代局部搜索算法,该算法通过基于成功历史的参数自适应差分进化(shade),工程优化。,1-17 (2019)
[46] Zohali,H。;Naderi,B。;穆罕默德(M.Mohammadi)。;Roshanaei,V.,重组、线性化和混合流水车间问题中经济批量和排序的混合迭代局部搜索算法,计算。操作。决议,104,127-138(2019)·Zbl 1458.90385号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。