×

层次树聚类中的NP-hard问题。 (英语) Zbl 0644.68055号

给定一个n元集(X={X_1,…,X_n})和一个对称矩阵(D=(D_{i,j}),其元素在对角线上为0,其他地方为正实数,X上的层次树T被定义为一系列对((P_i,l_i))((i=1,……,q)),其中(P_i\)是X的分区,这样的X(P_1={X_1\})、({X_2\},…、{X_n \}\}\),(P_q={X})和(P_i\)是(P_{i+1})(1\(leqi\leqq-1))的适当加细,并且(l_i\”是具有\(0=l_1<l_2<…<l_q\)的整数。整数q称为T的高度,(l_k)称为T中(P_k)的水平。如果(d_{i,j})是元素(x_i)和(x_j)之间“不同”的度量,那么层次聚类问题(HIC)直观上就是在x上找到一个“最优”的层次树(T^*)的问题从这个意义上说,它最大限度地减少了两个元素之间的差异以及它们第一次出现在分区中同一类中的树中的级别。
更正式地说,树\(T^*\)应该最小化目标函数F的值,该函数是从X上的层次树集到非负实数集定义的,如下所示:\[F(T)=sum_{1\leqi<j\leqn}|d_{i,j}-u_T(x _ i,x _ j)|\]其中,\(u_T\)是函数:\[u_T(x_i,x_j)=Min\{l_k|\quad\在P_k\quad中存在M\quad,例如\quad_{x_i、x_j\}\subseteq M\}\quad。\]该问题的一个变种称为(HIC_q\),它包括寻找固定高度q(2)的最优树
本文证明了对于(q\geq3\),HIC和(HIC_q\)问题是NP难的。
该证明基于一系列多项式约简。首先,证明了(HIC_q\propto HIC_{q+1}),其中(propto)表示多项式可约关系。然后,考虑了上述问题的二进制限制({}^bHIC)和({}^bHIC_q),即对每个非对角元素等于1或2的相异矩阵的限制,并证明了({}_bHIC_3与^bHIC:)。此时,通过NP-完全问题EC3(有序三元组的精确覆盖):(EC3\propto^bHIC_3)的约简证明了\({}^bHIC3\)的NP-手性。
审核人:G.毛里

MSC公司:

65年第68季度 算法和问题复杂性分析
68兰特 计算机科学中的图论(包括图形绘制)
65K10码 数值优化和变分技术
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Anderberg,M.:应用的聚类分析。纽约:学术出版社1973·Zbl 0299.62029号
[2] Brucker,P.:关于聚类问题的复杂性。摘自:《优化与运营研究》(R.Henn,B.Korte,W.Oletti eds.),第45-54页。柏林,海德堡,纽约:施普林格1977
[3] Diday,E,Bochi,S.,Brossier,G.,Celeux,G,Charles,C.,Chiflet,R.,Darcos,J.,Diday,F.:自动分类优化。印度,罗克扬科特,1979年
[4] Garey,M.R.,Johnson,D.S.:《计算机与难治性:NP-完备性理论指南》。旧金山:Freeman 1979·Zbl 0411.68039号
[5] Gonzales,T.:关于聚类的计算复杂性和相关问题。摘自:《系统建模与优化》(R.Drenick,F.Kozin eds.),第174-182页。柏林,海德堡,纽约:施普林格1982
[6] Hartigan,J.A.:聚类算法。纽约:约翰·威利1975·Zbl 0372.62040号
[7] Hartigan,J.A.:相似矩阵的树表示法。JASA 621140–1158(1967)
[8] Jambu,M.,Lebeaux,M.-O.:聚类分析和数据分析。阿姆斯特丹:北荷兰1983·Zbl 0521.62054号
[9] Jardine,N.,Sibson,R.:数学分类学。纽约:John Wiley 1971·Zbl 0322.62065号
[10] Johnson,S.C.:层次聚类方案。《心理测量学》32,241–254(1967)·兹比尔1367.62191 ·doi:10.1007/BF0228588
[11] Karp,R.M.:组合问题中的可约性。《计算机计算的复杂性》(E.W.Miller,J.W.Thatcher,eds.),第85-104页。纽约:Plenum Press 1972
[12] Křivánek,M.,Morávek,J.:《论层次聚类中的NP-Hardness》,收录于《84年COMPSTAT会议录》,第189-194页。维也纳:Physica 1984·Zbl 0577.62058号
[13] Lerman,I.C.:分类与分析顺序。巴黎:Dunod 1981
[14] Lovász,L.:组合问题和练习。布达佩斯:Akademiai Kiadó1979·Zbl 0439.05001号
[15] Späth,H.:数据简化和对象分类的聚类分析算法。伦敦:Ellis Horwood 1980·Zbl 0435.62059号
[16] Zahn,C.T.:用等价关系逼近对称关系。SIAM J.应用。数学。12, 840–847 (1964) ·Zbl 0129.16003号 ·数字对象标识代码:10.1137/0112071
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。