×

最大范数下的共聚类。 (英语) Zbl 1432.68172号

摘要:共聚类(Co-clustering),即将数值矩阵划分为“同质”子矩阵,具有从生物信息学到选举分析的许多应用。联合聚类的许多有趣变体是NP-hard。我们将重点放在联合聚类的基本变体上,其中子矩阵的同质性是根据最小化两个条目之间的最大距离来定义的。在这种情况下,我们发现了几个NP-hard,以及一些相关的多项式时间可解的特殊情况,从而为这个具有挑战性的数据聚类问题绘制了可处理的边界。例如,当必须将行和列分别划分为两个子集时,我们提供了多项式时间可解性(这意味着可以获得四个子集)。然而,当将行和列分别划分为三个子集时,我们会遇到NP-harrdness,即使输入矩阵只包含来自\(\{0,1,2\}\)的值。

MSC公司:

65年第68季度 算法和问题复杂性分析
15A23型 矩阵的因子分解
62H30型 分类和区分;聚类分析(统计方面)
2017年第68季度 问题的计算难度(下限、完备性、近似难度等)
68年第27季度 参数化复杂性、可处理性和核化
68T05型 人工智能中的学习和自适应系统

软件:

PicoSAT卫星
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 马德拉,S.C。;奥利维拉,A.L。;生物数据分析中的双聚类算法综述;IEEE/ACM传输。计算。生物信息:2004; 第1卷,24-45。
[2] Anagostopoulos,A。;Dasgupta,A。;库马尔,R。;一种用于共聚类的常数因子近似算法;理论计算:2012; 第8卷,597-622·Zbl 1297.68256号
[3] Banerjee,A。;迪伦,I.S。;Ghosh,J。;Merugu,S。;莫达,D.S。;Bregman共聚类和矩阵逼近的广义最大熵方法;J.马赫。学习。决议:2007年;第8卷,1919-1986年·兹比尔1222.68139
[4] Tanay,A。;沙兰,R。;沙米尔,R。;双聚类算法综述;计算分子生物学手册:博卡拉顿,佛罗里达州,美国2005年。
[5] Nguyen,S.H。;斯科伦,A。;实值属性的量化——粗糙集和布尔推理方法;第二届信息科学联合年会论文集:,34-37.
[6] 克勒布斯,B.S。;Nguyen,S.H.公司。;关于寻找两个属性的最优离散化;第一届粗糙集与当前计算趋势国际会议论文集(RSCTC’98):,537-544.
[7] Nguyen,H.S。;近似布尔推理:数据挖掘的基础与应用;粗糙集交易V:柏林-海德堡,德国2006,334-506. ·Zbl 1136.68497号
[8] 杰格尔卡,S。;Sra,S。;Banerjee,A。;张量聚类的近似算法;第20届国际算法学习理论会议论文集(ALT'09):,368-383. ·Zbl 1262.68151号
[9] 哈蒂根,J.A。;数据矩阵的直接聚类;J.Am.Stat.Assoc.:1972年;第67卷,第123-129页。
[10] 加利福尼亚州。;斯托洛维茨基,G。;Tu,Y。;用于表型分类的基因表达芯片分析;第八届分子生物学智能系统国际会议论文集(ISMB'00),AAAI:,75-85.
[11] Wulff,S。;Urner,R。;Ben-David,S。;单色双聚类;第30届国际机器学习大会论文集(ICML'13):,145-153.
[12] Cygan,M。;Fomin,F.V。;科瓦利克。;Lokshtanov,D。;马克思,D。;Pilipczuk,M。;Pilipczuk,M。;Saurabh,S;参数化算法:瑞士2015·Zbl 1334.90001号
[13] R.G.唐尼。;研究员,M.R;参数化复杂性基础:英国伦敦,2013·兹比尔1358.68006
[14] 尼德迈尔,R;固定参数算法邀请函:牛津,英国2006·兹比尔1095.68038
[15] M.R.加里。;约翰逊,D.S;计算机与不可修复性:NP-完全性理论指南:纽约,纽约,美国1979年·Zbl 0411.68039号
[16] 福勒,R.J。;帕特森,M.S。;Tanimoto,S.L.公司。;平面上的最优包装和覆盖是NP-完全的;信息处理。信函:1981; 第12卷,133-137·Zbl 0469.68053号
[17] Biere,A。;PicoSAT软件包;J.满意。布尔模型。计算:2008; 第4卷,75-97·Zbl 1159.68403号
[18] 兰伯特,C.H。;Nickisch,H。;Harmeling,S。;基于属性的零镜头视觉对象分类;IEEE传输。模式分析。机器。智力:2013; 第36卷,453-465。
[19] Aspvall,B。;普拉斯,M.F。;R.E.塔尔詹。;一种检验某些量化布尔公式真值的线性时间算法;信息处理。信函:1979年;第8卷,121-123·Zbl 0398.68042号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。