×

组合聚类的量子退火。 (英语) Zbl 1400.81071号

摘要:聚类是一种强大的机器学习技术,它根据“相似”数据点的特征对其进行分组。许多聚类算法通过近似目标函数的最小化来工作,即点之间的簇内距离之和。直截了当的方法包括检查每个簇的所有可能的点赋值。这种方法保证了解决方案是全局最小值;然而,可能的赋值数量随着数据点的数量迅速增加,并且即使对于非常小的数据集,也变得难以计算。为了避免这个问题,使用流行的基于局部搜索的启发式方法,如“(k)-均值”和层次聚类,可以找到成本函数的最小值。由于其贪婪的性质,这些技术不能保证找到全局最小值,并且可能导致次优聚类分配。其他类别的基于全局搜索的技术,如模拟退火、禁忌搜索和遗传算法,可能会提供更好质量的结果,但实施起来可能太耗时。在这项工作中,我们描述了如何使用量子退火进行聚类。我们将聚类目标映射到二次二进制优化问题,并讨论了两种聚类算法,然后将其在商用量子退火硬件和纯经典求解器“qbsolv”上实现第一种算法将(N)个数据点分配给(K)个簇,第二种算法可用于以层次方式执行二进制聚类。我们以基准测试的形式针对众所周知的(k)-均值聚类展示了我们的结果,并讨论了所提技术的优缺点。

MSC公司:

81页68 量子计算
68T05型 人工智能中的学习和自适应系统
2012年第68季度 计算理论中的量子算法和复杂性
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ben-Dor,A;沙米尔,R;Yakhini,Z,聚类基因表达模式,J.Compute。《生物学》,6281,(1999)·doi:10.1089/106652799318274
[2] Das,R.,Saha,S.:2016年IEEE进化计算大会(IEEE,2016),第3124-3130页
[3] Gorzałczany,M.B.,Rudzínski,F.,Piekoszewski,J.:2016年神经网络(IJCNN)国际联合会议,第3666-3673页
[4] 玛丽莎,L;雷尼耶斯,A;杜瓦尔,A;塞尔维斯,J;国会议员高布;维斯科沃,L;艾蒂安·格里马尔迪,MC;斯基亚帕,R;Guenot,D;Ayadi,M;等。,结肠癌分子亚型的基因表达分类:表征、验证和预后价值,PLoS Med.,10,e1001453,(2013)·doi:10.1371/journal.pmed.1001453
[5] Xie,P.,Xing,E.P.:CoRR abs/1309.6874。http://arxiv.org/abs/109.6874 (2013)
[6] Balabantaray,R.C.,Sarma,C.,Jha,M.:CoRR abs/1502.07938。http://arxiv.org/abs/1502.07938 (2015)
[7] Mudambi,S,《品牌在企业对企业市场中的重要性:三个买方集群》,Ind.Mark.Manag。,31, 525, (2002) ·doi:10.1016/S0019-8501(02)00184-0
[8] 夏尔马,A;Lambert,DM,《基于客户服务的市场细分》,国际J.Phys。配送物流。管理。,24, 50-58, (1994) ·doi:10.1108/09600039410757649
[9] KY Chan;Kwong,C;胡,BQ,使用模糊数据压缩和模糊聚类方法进行新产品设计的市场细分和理想点识别,应用。软计算。,12, 1371, (2012) ·doi:10.1016/j.asoc.2011.11.026
[10] Friedman,J.、Hastie,T.、Tibshirani,R.:《统计学习的要素》,第1卷。施普林格,纽约(2001)·Zbl 0973.62007号
[11] 哈蒂根,JA;Wong,MA,Algorithm AS 136:a k-means聚类算法,J.R.Stat.Soc.Ser。C(应用统计),28,100,(1979)·Zbl 0447.62062号
[12] Johnson,SC,层次聚类方案,《心理测量学》,32,241,(1967)·Zbl 1367.62191号 ·doi:10.1007/BF02289588
[13] Jain,AK,《数据聚类:超越K-means 50年》,模式识别。莱特。,31, 651, (2010) ·doi:10.1016/j.patrec.2009.09.011
[14] Garey,M.R.,Johnson,D.S.:《计算机与不可修复性:NP完全性理论指南》。W.H.Freeman&Co.,纽约(1979)·Zbl 0411.68039号
[15] Papadimitriou,CH,欧几里德旅行推销员问题是NP-完全的,Theor。计算。科学。,4, 237, (1977) ·Zbl 0386.90057号 ·doi:10.1016/0304-3975(77)90012-3
[16] 堪萨斯州Al-Sultana;Khan,MM,针对硬聚类问题的四种算法的计算经验,模式识别。莱特。,17, 295, (1996) ·doi:10.1016/0167-8655(95)00122-0
[17] 柯克帕特里克,S;盖拉特,CD;议员Vecchi;等。,模拟退火优化,科学,220671,(1983)·Zbl 1225.90162号 ·doi:10.1126/science.220.4598.671
[18] 塞利姆,SZ;Alsultan,K,聚类问题的模拟退火算法,模式识别。,24, 1003, (1991) ·doi:10.1016/0031-3203(91)90097-O
[19] Mitra,D.,Romeo,F.,Sangiovanni Vincentelli,A.:1985年第24届IEEE决策与控制会议,第24卷,第761-767页。IEEE(1985)
[20] 苏,H;Hartley,R,《快速模拟退火》,Phys。莱特。A、 122、157(1987)·doi:10.1016/0375-9601(87)90796-1
[21] Ingber,L,非常快速的模拟退火,数学。计算。型号。,12, 967, (1989) ·Zbl 0681.90091号 ·doi:10.1016/0895-7177(89)90202-1
[22] 布列曼,K;Lecocq,H,资源约束项目调度问题的一种新的高效模拟退火算法及其多模式版本,Eur.J.Oper。决议,149,268,(2003)·Zbl 1040.90015号 ·doi:10.1016/S0377-2217(02)00761-0
[23] Kadowaki,T;Nishimori,H,横向伊辛模型中的量子退火,Phys。E版,58,5355,(1998)·doi:10.1103/PhysRevE.58.5355
[24] 通用电气桑托罗公司;Tosatti,E,《量子力学优化:绝热演化中的量子退火》,J.Phys。数学。Gen.,39,r393,(2006)·Zbl 1130.49037号 ·doi:10.1088/0305-4470/39/36/R01
[25] Denchev,VS;博伊索,S;伊萨科夫,SV;丁,N;Babbush,右;斯迈扬斯基,V;Martinis,J;Neven,H,有限范围隧道的计算值是多少?,物理学。版本X,6031015,(2016)
[26] 出生,男;Fock,V,Beweis des adiabatestazes,Z.Angew。物理。,51, 165, (1928) ·doi:10.1007/BF01343193
[27] Albash,T.,Lidar,D.A.:ArXiv电子版(2016)
[28] Biamonte,J.,Wittek,P.,Pancotti,N.,Rebentrost,P.,Wiebe,N.,Lloyd,S.:ArXiv电子印刷品(2016)
[29] Dulny,J.,III,Kim,M.:ArXiv电子版(2016)
[30] Neven,H.,Denchev,V.S.,Drew-Brook,M.,Zhang,J.,Macready,W.G.,Rose,G.:使用量子退火硬件实现的二进制分类。摘自:NIPS-09的演示,第24届神经信息处理系统年会,第1-17页(2009年)
[31] Denchev,V.S.:绝热量子优化的二进制分类。普渡大学博士论文(2013)
[32] Farinelli,A.:《自然计算理论与实践:第五届国际会议》,TPNC 2016,日本仙台,2016年12月12-13日,《会议记录》,第10071卷,第175页。斯普林格(2016)
[33] Kurihara,K.,Tanaka,S.,Miyashita,S.:第二十五届人工智能不确定性会议论文集,第321-328页。AUAI出版社(2009)
[34] 佐藤,I;田中,S;Kurihara,K;宫下县;Nakagawa,H,Dirichlet过程混合模型的量子退火及其在网络聚类中的应用,神经计算,121,523,(2013)·doi:10.1016/j.neucom.2013.05.019
[35] Ising,E,无文章标题,Zeitschrift für Physik,31253,(1925)·Zbl 1439.82056号 ·doi:10.1007/BF02980577
[36] Dahl,E.D.:用D-wave编程:地图着色问题。D-Wave官方白皮书(2013)
[37] 石川浩,H,一般二进制MRF最小化到一阶情形的转换,IEEE Trans。模式分析。机器。智力。,33, 1234, (2011) ·doi:10.10109/TPAMI.2010.91
[38] Booth,M.、Reinhardt,S.P.、Roy,A.:混合经典/量子执行的分区优化问题。技术报告,第1-9页(2017年)
[39] 佩德雷戈萨,F;瓦罗佐,G;Gramfort,美国;米歇尔,V;蒂里昂,B;格栅,O;布隆德尔,M;普雷滕霍弗,P;韦斯,R;杜堡,V;范德普拉斯,J;帕索斯,A;库尔纳波,D;布鲁彻,M;佩罗,M;Duchesnay,E,Scikit-learn:《蟒蛇的机器学习》,J.Mach。学习。决议,12,2825,(2011)·Zbl 1280.68189号
[40] Arthur,D.,Vassilvitskii,S.:第十八届ACM-SIAM离散算法年会论文集,第1027-1035页。工业和应用数学学会(2007)·兹比尔1302.68273
[41] Savaresi,S.M.,Boley,D.L.:2001年SIAM国际数据挖掘会议记录,第1-14页。SIAM(2001)·Zbl 0983.68060号
[42] Cai,J.、Macready,W.G.、Roy,A.:arXiv预印本arXiv:1406.2741(2014)
[43] 盖诺切,A;汉森,P;Jaumard,B,带直径准则的除法层次聚类的高效算法,J.Classif。,8, 5, (1991) ·Zbl 0739.62050号 ·doi:10.1007/BF02616245
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。