×

双模(KL)-意味着划分问题的精确算法。 (英语) Zbl 1331.62303号

摘要:双模划分应用程序在物理和社会科学中越来越常见,有各种模型和方法跨越这些应用程序。双模(KL)均值分割(TMKLMP)是一种具有概念吸引力的双模分割模型,其主要原因是它是普遍存在的(单模)均值聚类问题的推广。针对TMKLMP提出了许多启发式方法,从两模式版本的K均值启发式到基于模拟退火、遗传算法、可变邻域搜索、模糊步骤和禁忌搜索的元启发式方法。我们提出了一种基于分枝定界规划的TMKLMP精确算法,并证明了其在品牌转换、制造单元形成和期刊引文数据聚类中的实用性。虽然所提出的branchand-bound算法并没有消除对大型双模数据集的近似方法的需要,但它确实为开发能够保证TMKLMP全局最优解的方法迈出了第一步。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62-07 数据分析(统计)(MSC2010)
05C85号 图形算法(图形理论方面)
90C27型 组合优化
90-04 与运筹学和数学编程有关的问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ALOISE,D.、HANSEN,P.和LIBERTI,L.(2012),“最小平方和聚类的改进列生成算法”,数学规划A,131195-220·Zbl 1236.90095号 ·doi:10.1007/s10107-010-0349-7
[2] BAIER,D.、GAUL,W.和SCHADER,M.(1997),《双模重叠聚类及其在同时利益分割和市场结构中的应用》,收录于《分类与知识组织》,编辑R.Kar和O.Opitz,海德堡:Springer,第557-566页。
[3] BALAS,E.(1965年),“求解具有零一变量的线性程序的加法算法”,《运筹学》,第13期,第517-546页·Zbl 0194.19903号
[4] BASS,F.M.、PESSEMIER,E.A.和LEHMANN,D.R.(1972),“品牌偏好和选择态度之间关系的实验研究”,《行为科学》,第17期,第532-541页·doi:10.1002/bs.3830170604
[5] BOTH,M.和GAUL,W.(1985),“彭斯:营销应用的惩罚聚类”,第82号讨论文件,卡尔斯鲁厄大学决策理论与运筹研究所·Zbl 1337.62145号
[6] BOTH,M.和GAUL,W.(1987),“Ein Vergleich Zweimodaler Clusteranalyseverfahren”,《运筹学方法》,57,593-605。
[7] BOYD,J.P.、FITZGERALD,W.J.、MAHUTGA,M.C.和SMITH,D.A.(2010年),“使用MINRES/SVD计算社会关系数据的连续核心/外围结构”,《社交网络》,第32期,第125-137页·doi:10.1016/j.socnet.2009.09.003
[8] BRUSCO,M.J.(2006),“最小平方和的重复分枝定界算法”,《心理学》,71,347-363·Zbl 1306.62387号 ·doi:10.1007/s11336-004-1218-1
[9] BRUSCO,M.(2011),“使用非负矩阵分解分析双模网络数据”,《社交网络》,第33期,第201-210页。
[10] BRUSCO,M.、DOREIAN,P.、MRVAR,A.和STEINEY,D.(2013),“双模网络数据块建模的精确算法”,《数学社会学杂志》,第37期,第61-84页·Zbl 1279.91137号 ·doi:10.1080/0022250X.2011.597278
[11] 布鲁斯科,M。,和STAHL,S.(2005a),《组合数据分析中的分枝定界应用》,纽约:施普林格出版社·Zbl 1093.62006年
[12] BRUSCO,M.J.和STAHL,S.(2005b),“最优最小二乘一维尺度:改进的分枝定界程序和与动态规划的比较”,《心理测量学》,70,253-270·兹比尔1306.62388 ·doi:10.1007/s11336-002-1032-6
[13] BRUSCO,M.和STEINEY,D.(2007a),“二模二进制矩阵广义块建模的可变邻域搜索方法”,《数学心理学杂志》,51,325-338·Zbl 1151.91731号 ·doi:10.1016/j.jmp.2007.07.001
[14] BRUSCO,M.J.和STEINEY,D.(2007b),“基于区间图和Robinson矩阵之间关系的零件-机器聚类的精确和近似算法”,IIE事务,39,925-935·doi:10.1080/07408170701411393
[15] CARBONNEAU,R.A.、CAPOROSSI,G.和HANSEN,P.(2012),“全球最优聚类回归重复分枝定界算法的扩展”,《计算机与运筹学》,第39期,第2748-2762页·Zbl 1251.90313号 ·doi:10.1016/j.cor.2012.02.007
[16] CASTILLO,W.和TREJOS,J.(2002),《两种模式划分:禁忌搜索方法和应用的回顾》,《分类、聚类和数据分析》,编辑K.Jajuga,A.Sololowski和H.Bock,柏林:Springer,第43-51页·Zbl 1040.62053号
[17] CHAN,H.M.和MILNER,D.A.(1982),“细胞制造中组形成的直接聚类算法”,《制造系统杂志》,1,65-74·doi:10.1016/S0278-6125(82)80068-X
[18] CLAPHAM,C.(1996),《简明牛津数学词典》,纽约:牛津大学出版社·Zbl 0873.00004号
[19] COLOMBO,R.A.、EHRENBERG,A.S.C.和SABAVALA,D.J.(1994),“汽车挑战:分析品牌转换表的多样性”,工作文件,纽约大学·Zbl 0850.62475号
[20] DESARBO,W.S.(1982),“GENNCLUS:一般非层次聚类分析的新模型”,《心理测量学》,47,449-475·Zbl 0566.62057号 ·doi:10.1007/BF02293709
[21] DESARBO,W.S.和DE SOETE,G.(1984),“关于使用层次聚类分析非对称邻近性”,《消费者研究杂志》,第11期,第601-610页·doi:10.1086/208996
[22] DOREIAN,P.(1985),“心理学期刊网络中的结构等效性”,《美国信息科学学会期刊》,第36期,第411-417页·Zbl 0432.05004号
[23] DOREIAN,P.(1988),“在地理期刊网络中测试结构等效假设”,《美国信息科学学会杂志》,39,79-85。
[24] DOREIAN,P.、BATAGELJ,V.和FERLIGOJ,A.(2004),“双模网络数据的广义块建模”,《社交网络》,26,29-53·doi:10.1016/j.socnet.2004.01.002
[25] DOREIAN,P.、BATAGELJ,V.和FERLIGOJ,A.(2005),广义块建模,剑桥:剑桥大学出版社·Zbl 1181.68106号
[26] DOREIAN,P.和FARARO,T.J.(1985),“期刊网络中的结构等效性”,《美国信息科学学会期刊》,36,28-37·doi:10.1002/asi.4630360103
[27] DOREIAN,P.、LLOYD,P.和MRVAR,A.(2013),“划分大型签名双模网络:问题和前景”,《社交网络》,第35期,第178-203页·doi:10.1016/j.socnet.2012.01.002
[28] FORGY,E.W.(1965),“多元数据的聚类分析:分类的效率与可解释性”,《生物统计学文摘》,第21768-769页。
[29] GAUL,W.和SCHADER,M.(1996),“双模聚类的新算法”,收录于H.Bock&W.Polasek(编辑),《数据分析和信息系统》,编辑H.Bok和W.Polasek,柏林:Springer,第15-23页·Zbl 0896.62060号
[30] GROENEN,P.J.F.和HEISER,W.J.(1996),“多维尺度下全局优化的隧道方法”,《心理测量学》,61529-550·Zbl 0866.92028号 ·doi:10.1007/BF022954553
[31] HANSEN,P.和DELATTRE,M.(1978),“通过图着色进行全链路聚类分析”,美国统计协会杂志,73397-403·Zbl 0432.05004号 ·doi:10.1080/01621459.1978.10481589
[32] HANSOHM,J.(2002),“用遗传算法进行双模聚类”,载于《分类、自动化和新媒体》,W.Gaul和G.Ritter编辑,柏林:Springer出版社,第87-93页。
[33] HARTIGAN,J.(1972),“数据矩阵的直接聚类”,《美国统计协会杂志》,第67期,第123-129页。
[34] HOFFMAN,D.L.、VAN DER HEIJDEN,P.G.M.和NOVAK,T.P.(2001),“分类消费者选择数据中的映射不对称”,工作文件,检索自http://www.academia.edu/2611216/Mapping_asymmetry_in_categorical_consumer_choice_data ·Zbl 1279.91137号
[35] HUBERT,L.和ARABIE,P.(1985),“比较划分”,《分类杂志》,第2期,193-218页·doi:10.1007/BF01908075
[36] KLEIN,G.和ARONSON,J.E.(1991),“最优集群:模型和方法”,海军研究后勤,38,447-461·Zbl 0721.92031号 ·doi:10.1002/1520-6750(199106)38:3<447::AID-NAV3220380312>3.0.CO;2-0
[37] KOONTZ,W.L.G.、NARENDRA,P.M.和FUKUNAGA,K.(1975),“分支定界聚类算法”,IEEE计算事务,C-24908-915·Zbl 0308.68039号
[38] LAND,A.H.和DOIG,A.(1960),“解决离散编程问题的自动方法”,《计量经济学》,第28期,第497-520页·Zbl 0101.37004号 ·doi:10.2307/1910129
[39] MACQUEEN,J.B.(1967),“多元观测分类和分析的一些方法”,载于《第五届伯克利数理统计与概率研讨会论文集》(第1卷),L.M.Le Cam和J.Newman编辑,加州伯克利:加州大学出版社,第281-297页·Zbl 0214.46201号
[40] MADEIRA,S.C.和OLIVEIRA,A.L.(2004),“生物数据分析的双聚类算法:调查”,IEEE计算生物学和生物信息学汇刊,1,24-45·doi:10.1109/TCBB.2004.2
[41] MIRKIN,B.、ARABIE,P.和HUBERT,L.J.(1995),《加性双模聚类:重新审视误差方差法》,《分类杂志》,第12期,第243-263页·Zbl 0850.62475号 ·doi:10.1007/BF03040857
[42] MISCHE,A.和PATTISON,P.(2000),“构建公民竞技场:公共、项目和社会环境”,《诗学》,第27期,第163-194页·doi:10.1016/S0304-422X(99)00024-8
[43] MOSTELLER,F.(1968),“列联表中的关联和估计”,《美国统计协会杂志》,63,1-28·Zbl 1306.62388号
[44] PALUBECKIS,G.(1997),“使用多面体结果解决聚类问题的分枝定界方法”,《信息计算杂志》,9,30-42·Zbl 0890.90175号
[45] PRELI Ch,A.、BLUELER,S.、ZIMMERMANN,P.、WILLE,A.、BüHLMANN,P.,GRUISSEM,W.、HENNIG,L.、THIELE,L.和ZITZLER,E.(2006),“基因表达数据双聚类方法的系统比较和评估”,生物信息学,22,1122-1129·doi:10.1093/bioinformatics/btl060
[46] RAO,V.R.和SABAVALA,D.J.(1981),“从面板数据推断层次选择过程”,《消费者研究杂志》,第8期,第85-96页·doi:10.1086/208844
[47] RAO,V.R.、SABAVALA,D.J.和LANGFELD,P.A.(1977),“基于品牌转换数据的分区分析替代措施”,工作文件,康奈尔大学·Zbl 1306.62387号
[48] SCHEPERS,J.、CEULEMANS,E.和VAN MECHELEN,I.(2008),“不同复杂度的多模划分模型的选择”,分类杂志,2567-85·Zbl 1260.62048号 ·doi:10.1007/s00357-008-9005-9
[49] SCHEPERS,J.和VAN MECHELEN,I.(2011年),“捕获大型数据矩阵中主要交互模式本质的双模聚类方法”,《心理学方法》,第16期,第361-371页·doi:10.1037/a0024446
[50] SELIM,H.M.、ASKIN,R.G.和VAKHARIA,A.J.(1998),“群组技术中的细胞形成:未来研究的回顾、评估和方向”,计算机与工业工程,34,3-20·doi:10.1016/S0360-8352(97)00147-2
[51] STEINHAUS,H.(1956年),“各方兵团物资保障部”,《科学通报》,第三、四类(12),801-804·Zbl 0079.16403号
[52] STEINEY,D.(2006),“K-means Clustering:A Half Century Synthesis”,《英国数学与统计心理学杂志》,59,1-34。
[53] TREJOS,J.和CASTILLO,W.(2000),“双模分割的模拟退火优化,收录于《世纪之交的分类和信息》,编辑:W.Gaul和R.Decker,海德堡:Springer,。第135-142页。
[54] VAN MECHELEN,I.、BOCK,H.H.和DEBOEK,P.(2004),“双模聚类方法:结构化综述”,医学研究中的统计方法,13363-394·兹比尔1053.62078 ·doi:10.1191/0962280204sm373ra
[55] VAN ROSMALEN,J.、GROENEN,P.J.F.、TREJOS,J.和CASTILLO,W.(2009),“双模分区的优化策略”,《分类杂志》,26,155-181·Zbl 1337.62145号 ·doi:10.1007/s00357-009-9031-2
[56] VAN UITERT,M.、MEULEMAN,W.和WESSELS,L.(2008),“双聚类稀疏二进制基因组数据”,《计算生物学杂志》,第15期,第1329-1345页·doi:10.1089/cmb.2008.0066
[57] VICHI,M.(2001),《分类和数据分析进展——分类、数据分析和知识组织研究》,编辑S.Borra,R.Rocchi和M.Schader,Heidelberg:Springer,第43-52页,“双重K-means聚类用于同时分类对象和变量”。
[58] WILDERJANS,T.F.、DEPRIL,D.和VAN MECHELEN,I.(2013),“加性双聚类:一种新的和两种现有的ALS算法的比较”,《分类杂志》,30,56-74·Zbl 1360.62364号 ·doi:10.1007/s00357-013-9120-0
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。