×

ADCLUS和INDCLUS:分析、实验和元神经算法扩展。 (英语) 2014年4月14日

总结:ADCLUS和INDCLUS模型以及相关的拟合技术可用于从相似性数据中提取重叠的聚类结构。在本文中,我们检查了这些模型的可伸缩性。我们在中等大小的数据集上测试了SINDLCUS算法和SYMPRES算法的一个改进版本,并尝试推断它们的可扩展性以及随着问题大小的增加局部最优问题的程度。我们描述了几种用于最小化INDCLUS和ADCLUS损失函数的元神经方法。

MSC公司:

62-07 数据分析(统计)(MSC2010)
62H30型 分类和区分;聚类分析(统计方面)
91C20个 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alimoglu F,Alpaydin E(1996)基于不同表示的多分类器组合方法,用于手写体识别。收录:第五届土耳其人工智能和人工神经网络研讨会论文集(TAINN 96)。http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.47.6383
[2] 贝克曼R(2005)《重复测量设计的推荐效应大小统计》。Behav Res方法37(3):379-384。doi:10.3758/BF03192707·doi:10.3758/BF03192707
[3] Barthélemy JP,Brucker F(2001)重叠聚类中的NP-hard近似问题。J Classif 18(2):159-183。doi:10.1007/s00357-001-0014-1·Zbl 1040.91084号 ·doi:10.1007/s00357-001-0014-1
[4] Brodley C(1990)图像分割数据集。http://archive.ics.uci.edu/ml/datasets/Image+细分
[5] Brusco MJ(2001)对称邻近矩阵的一维和多维(城市块)缩放的模拟退火启发式算法。J类18(1):3-33·Zbl 1040.91080 ·文件编号:10.1007/s00357-0003-4
[6] Carroll JD,Arabie P(1980)多维缩放。《心理学年鉴》31(1):607-649。doi:10.1146/annurev.ps.31.020180.003135,doi:10.1 146/annerev.ps.31.02180.003135;M3:doi:10.1146/annurev.ps.31.020180.003135;18
[7] Carroll JD,Arabie P(1983)INDCLUS:ADCLUS模型和MAPCLUS算法的个体差异泛化。《心理测量学》48(2):157-169·doi:10.1007/BF02294012
[8] Carroll JD,Chang JJ(1970)通过“Eckart-Young”分解的n向推广分析多维标度中的个体差异。《心理测量学》35(3):283-319·Zbl 0202.19101号 ·doi:10.1007/BF02310791
[9] Caruana R、Joachims T、Backstrom L(2004)KDD-cup 2004:结果与分析。SIGKDD探索新闻6(2):95-108。http://doi.acm.org/10.1145/1046456.1046470
[10] Ceulemans E,Van Mechelen I(2008)CLASSI:用于研究序列过程及其个体差异的分类模型。《心理学》73(1):107-124。doi:10.1007/s11336-007-9024-1·Zbl 1143.62092号 ·doi:10.1007/s11336-007-9024-1
[11] Ceulemans E,Van Mechelen I,Leenen I(2007)分层类分析中的局部极小问题:模拟退火算法和各种多段程序的评估。《心理学》72(3):377-391。doi:10.1007/s11336-007-9000-9·Zbl 1286.62102号 ·doi:10.1007/s11336-007-9000-9
[12] Chaturvedi A,Carroll JD(1994)用于拟合INDCLUS和广义INDCLUS模型的交替组合优化方法。J类11(2):155-170·Zbl 0825.62539号 ·doi:10.1007/BF01195676
[13] Chaturvedi A,Carroll JD(2001)通过市场份额的加性分解推导市场结构(三向广义SINDCLUS的应用)。发表于罗格斯大学DIMACS中心DIMACS多维缩放算法研讨会
[14] Cook D(1997)互联网使用数据集。http://archive.ics.uci.edu/ml/datasets/Internet+用法+数据
[15] Cortez P、Cerdeira A、Almeida F、Matos T、Reis J(2009)通过物理化学性质的数据挖掘建模葡萄酒偏好。Decis支持系统47(4):547-553·doi:10.1016/j.dss.2009.05.016
[16] Deneke T、Haile H、Lafond S、Lilius J(2014)《主动负载平衡的视频转码时间预测》。2014年IEEE多媒体与博览会国际会议(ICME),第1-6页
[17] Depril D,Van Mechelen I,Mirkin B(2009)矩形数据表加性聚类算法。计算统计数据分析52(11):4923-4938·Zbl 1452.62439号 ·doi:10.1016/j.csda.2008.04.014
[18] Fanty M,Cole R(1990)《语音识别》,摩根·考夫曼。,圣马特奥。主题:神经信息处理系统进展第3卷,第220-226页
[19] Fisher ML(2004)求解整数规划的拉格朗日松弛法。《管理科学》50(12):1861-1871·doi:10.1287/mnsc.1040.0263
[20] France SL,Abbasi A(2011)使用聚类优化和多标签学习促进无监督加性聚类。2011年IEEE第11届国际数据挖掘研讨会(ICDMW)IEEE,加利福尼亚州洛斯阿拉米托斯,第236-243页
[21] Gill JL(1973)设计实验中多重平均值比较的现状。《乳制品科学杂志》56(8):973-977。http://www.sciencedirect.com/science/article/pii/S022030273852291
[22] Glover F(1989)禁忌搜索第一部分ORSA J Comput 1(3):190-206·Zbl 0753.90054号 ·doi:10.1287/ijoc.1.3.190
[23] Glover F(1990)Tabu搜索部分II。ORSA J计算2(1):4-32·Zbl 0771.90084号 ·doi:10.1287/ijoc.2.1.4
[24] Hamalainen W,Nykanen M(2008),有效发现具有统计意义的关联规则。In:ICDM’08。第八届IEEE数据挖掘国际会议,IEEE出版社,Los Alamitos pp 203-212
[25] Hansen P,Meyer C(2014),一类涉及复合函数的01分式规划问题的多项式算法,应用于加性聚类、聚类、顺序和树:方法和应用,第92卷。施普林格,纽约
[26] Hersh W,Buckley C,Leone T,Hickam D(1994)OHSUMED:交互式检索评估和新的大型研究测试集。摘自:第17届ACM SIGIR国际信息检索研究与开发年会论文集,爱尔兰都柏林,纽约斯普林格弗拉格,第192-201页
[27] Horton P,Nakai K(1996)预测蛋白质细胞定位位点的概率分类系统。AAAI,门罗公园,第109-115页。http://www.aaai.org/Papers/ISMB/1996/ISMB96-012.pdf
[28] Kiers HAL(1997)SINDCLUS算法的修改,用于拟合ADCLUS和INDCLUS模型。J类14(2):297-310·Zbl 0900.92187号 ·数字标识代码:10.1007/s003579900014
[29] Lawrence MA(2015)包“ez”:阶乘实验的简单分析和可视化。https://cran.r-project.org/web/packages/ez/ez.pdf
[30] Lee MD,Navarro DJ(2005)最小描述长度和心理聚类模型。In:《最小描述长度理论与应用进展》,神经信息处理系列,麻省理工学院出版社,剑桥,第355-384页
[31] Meek C,Thiesson B,Heckerman D(2002)《学习曲线抽样法应用于基于模型的聚类》,《机械学习研究杂志》2:397-418。doi:10.1162/1532443027600678·Zbl 1007.68082号 ·doi:10.1162/1532443027600678
[32] Nash WJ、Sellers TL、Talbot SR、Cawthorn AJ、Ford WB(1994)塔斯马尼亚州鲍鱼(鲍鱼属)的种群生物学。I.巴斯海峡北海岸和群岛的黑唇鲍(h.rubra)”,海洋渔业部,第48号技术报告
[33] Neslin SA、Sunil G、Kamakura WA、Lu J、Mason CH(2006)《缺陷检测:测量和了解客户流失模型的预测准确性》。J市场研究43(2):204-211·doi:10.1509/jmkr.43.2.04
[34] Rao RB、Yakhnenko O、Krishnapuram B(2008)KDD cup 2008和医学数据挖掘研讨会。SIGKDD探索10(2):34-38。http://doi.acm.org/10.1145/1540276.1540288
[35] Richardson JTE(2011)Eta平方和部分Eta平方作为教育研究中效果大小的度量。教育研究第6版(2):135-147·doi:10.1016/j.edurev.2010.12.001
[36] van Rosmalen J、Groenen PJF、Trejos J、Castillo W(2009)《双模分区的优化策略》。J类26(2):155-181·Zbl 1337.62145号 ·doi:10.1007/s00357-009-9031-2
[37] Ruml W(2002)使用加性聚类构建分布式表示。In:Dietterich TG,Becker S,Ghahramani Z(eds)《2001年神经信息处理系统(NIPS)会议论文集》。麻省理工学院出版社,波士顿
[38] Schlimmer J(1987)蘑菇数据集。http://archive.ics.uci.edu/ml/datasets/Mushroom
[39] Shepard RN,Arabie P(1979)《加性聚类:相似性表示为离散重叠属性的组合》。《心理学评论》86(2):87-123·doi:10.1037/0033-295X.86.2.87
[40] Strehl A,Ghosh J,Mooney R(2000)相似性度量对网页聚类的影响。摘自:第17届全国人工智能会议论文集:网络搜索人工智能研讨会(AAAI 2000),2000年7月30日至31日,德克萨斯州奥斯汀,AAAI,剑桥,第58-64页
[41] Ten Berge JMF,Kiers HAL(2005)《两种拟合INDCLUS模型方法的比较》。J类22(2):273-286·兹比尔1336.62202 ·doi:10.1007/s00357-005-0017-4
[42] Tenenbaum JB(1996)学习相似结构。摘自:《神经信息处理系统》,第8卷,麻省理工学院出版社,剑桥,第59-65页
[43] Van Laarhoven PJM,Aarts EH(1987)《模拟退火:理论和应用(数学及其应用)》,第1版。多德雷赫特·克鲁沃·Zbl 0643.65028号 ·doi:10.1007/978-94-015-7744-1
[44] Van Mechelen I,Bock HH,Boeck PD(2004)《双模聚类方法:结构化概述》。统计方法医学研究13(5):363-394·Zbl 1053.62078号 ·doi:10.1191/0962280204sm373ra
[45] Vera JF,Heiser WJ,Murillo A(2007)《任何Minkowski度量的全局优化:多维缩放的置换转换模拟退火算法》。J类24(2):277-301·Zbl 1159.91469号 ·doi:10.1007/s00357-007-0020-1
[46] Voorhees EM(2008)TREC文本检索会议。http://trec.nist.gov
[47] Wilderjans T,Ceulemans E,Van Mechelen I(2008)CHIC模型:耦合二进制数据的全局模型。《心理学》73(4):729-751。doi:10.1007/s11336-008-9069-9·Zbl 1284.62767号 ·doi:10.1007/s11336-008-9069-9
[48] Wilderjans TF,Ceulemans E,Van Mechelen I(2012a)SIMCLAS模型:耦合二进制数据矩阵的同时分析,数据块之间和内部存在噪声异质性。心理测量学77(4):724-740。doi:10.1007/s11336-012-9275-3·Zbl 1284.62766号 ·doi:10.1007/s11336-012-9275-3
[49] Wilderjans TF、Depril D、Van Mechelen I(2012b)适用于INDCLUS模型的区块再释放方法。J类29(3):277-296。文件编号:10.1007/s00357-012-9113-4·Zbl 1360.62363号 ·文件编号:10.1007/s00357-012-9113-4
[50] Wolberg WH,Mangasarian OL(1990)用于乳腺细胞学医学诊断的多表面模式分离方法。国家科学院院刊87(23):9193-9196·Zbl 0709.92537号 ·doi:10.1073/pnas.87.23.9193
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。