{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,8,15]],“日期-时间”:“2024-08-15T11:10:30Z”,“时间戳”:1723720230683},“参考-计数”:47,“出版商”:“Springer Science and Business Media LLC”,“问题”:“3”,“许可证”:[{“开始”:}“日期-零件”:[2020,10,2]],“时间”:“2020-10-02T00:00:00Z”,“timestamp”:1601596800000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/creativecommons.org\/licenses\/by\/4.0”},{“start”:{“date-parts”:[[2020,10,2],“date-time”:“2020-10-02T00:00:00Z”,“timetamp”:16001596800000neneneep,“content-version”:“vor”,“delay-in-days”:“0,”URL“https:\\/creativecommons.org\/licenses\/by\/4.0“}],“出资人”:[{“DOI”:“10.13039\/501100003500”,“name”:“Universit\u00e0 degli Studi di Padova”,“doi-asserted-by”:“crossref”,”id“:[{“id”:“10.13029\/5011000003500”,“id-type”:“doi”,“asserted-by”:“crassref”}]],“content-domain”:{“domain”:[“link.springer.com”],“crossmark-restriction”:false},“short-container-title”:[“Adv Data Anal Classif”“],”published-print“:{”date-parts“:[[2021,9]]},“摘要”:“摘要<\/jats:title>随着最近数据可用性和复杂性的增长,以及复杂建模方法的爆发,模型选择工具已成为一条生命线,为应对这一日益具有挑战性的形势提供了客观标准。事实上,基于单一模型的预测和推断即使无害,也可能是有限的;集成方法结合了不同的模型,被提出来克服选择步骤,并被证明是卓有成效的,特别是在有监督的学习框架中。相反,这些方法在无监督的环境中很少被探索。在这项工作中,我们将重点放在基于模型的聚类公式上,其中通常估计了具有不同数量组件和参数化的大量混合模型。我们提出了一种集成聚类方法,它绕过了单一最佳模型范式,同时提高了分区的稳定性和健壮性。引入了一种新的密度估计量,它是集合中密度估计量的凸线性组合,并将其用于群分配。与标准情况不同,集群通常与所选混合模型的组件相关联,我们通过借用集群问题的模式或非参数公式来定义分区,其中组与高密度区域相关联。因此,在基于密度的领域中,我们展示了从聚类的角度来看,将参数和非参数方法混合在一起是如何有益的<\/jats:p>“,”DOI“:”10.1007\/s11634-020-00423-6“,”type“:”journal-article“,”created“:{”date-parts“:[[2020,10,2],”date-time“:”2020-10-02T07:02:58Z“,”timestamp“:1601622178000},”page“:referenced-by-count“:4,”title“:[“比最好的更好?通过基于密度聚类中的模型集合回答“],”前缀“:”10.1007“,”卷“:”15“,”作者“:[{”ORCID“:”http://\/ORCID.org\/0000-0002-2929-3850“,”authenticated-ORCID“:false,”给定“:”Alessandro“,”家族“:”Casa“,”序列“:”first“,”affiliation“:[]},”给定的“:”Luca“,”家庭“:”Scrucca“,“sequence”:“additional”,“afliation”:[]{,{“给定”:Giovanna“,”family“:”Menardi“,”sequence“:”additional“,”affiliation“:[]}],”member“:”297“,”published-on-line“:{”date-parts“:[2020,10,2]},”reference“:[{”issue“:”3“,”key“:”423_CR1“,“doi-asserted-by”:“publisher”,“first page”:“228”,“doi”:“10.1038\/nmeth.2365”,”volume“:“10”,“author”:“”N Aghaeepour”,“年份”:“2013年”,“非结构化”:“Aghaeepour N、Finak G、Hoos H、Mosmann T、Brinkman R、Gottardo R、Scheuermann R、FlowCAP Consortium、DREAM Consortius(2013)自动化流式细胞术数据分析技术的关键评估。Nat Methods 10(3):228“,”journal-title“:”Nat Methods“},{”issue“:”4“,”key“:”423_CR2“,”doi-asserted-by“:”publisher“,”first page“:“715”,”doi“:”10.1093/biomet\/83.4.715“,”volume“:):715\u2013726“,”journal-title“:“Biometrika”},{“key”:“423_CR3”,“doi-asserted-by”:“crossref”,“unstructured”:“Banfield J,Raftery AE(1993)基于模型的高斯和非高斯聚类。生物统计学49(3):803\u2013821”,“doi”:“10.2307\/2532201”}198\/jcgs.2010.08111“,”卷“:”19“,”author“:”JP Baudry“,”year“:”2010“,”unstructured“:”Baudry JP,Raftery AE,Celeux G,Lo K,Gottardo R(2010)组合混合成分进行聚类。J Comput Graph Stat 19(2):332\u2013353“,”journal-title“:”J Comput-Graph Stat“},{“issue”:“7”,“key”:“423_CR5”,“doi-asserted-by”:“publisher”,“first-page”:“719”,“doi”:“10.1109\/34.86 5189“,”volume“:”22“,”author“:”C Biernacki“,”year“:”2000“,”unstructured“:”Biernackei C,Celeux G,Govaert G(2000)用综合完全似然评估聚类的混合模型。IEEE T Pattern Anal 22(7):719\u2013725”,“期刊标题”:“IEEE T Pattern Anal”},{“issue”:“5”,“key”:“423_CR6”,“doi断言”:“publisher”,“首页”:“781”,“doi”:“10.1016\/001-3203(94)00125-6”,“volume”:“28”,“author”:“G Celeux”,“year”:“1995”,“nonstructured”:“Celeux G,Govaert G(1995)高斯简约聚类模型。模式识别器28(5):781\u2013793“,”journal-title“:”Pattern Recognit“},{”issue“:”2“,”key“:”423_CR7“,”doi-asserted-by“:”publisher“,”first page“:“379”,”doi“:”10.1007\/s11634-018-0308-3“,”volume“:Classif 13(2):379\u2013404“,”新闻标题“:”Adv Data Anal Classif“},{“key”:“423_CR8”,“doi-asserted-by”:“publisher”,“doi”:“10.1201\/9780429485572”,“volume-title”:“多元核平滑及其应用”,“author”:“JE Chac\u00f3n”,“year”:“2018”,“unstructured”:“Chac\u 00f3n-JE,Duong T(2018)多元核平滑及应用。Chapman and Hall,CRC,伦敦”},}“issue“:”8“,”key“:”423_CR9“,”doi-asserted-by“:”publisher“,”first page“:“790”,”doi“:”10.1109\/34.400568“,“volume”:“17”,“author”:“Y Cheng”,“year”:“1995”,“unstructured”:“Cheng Y(1995)Mean shift,mode searching,and clustering。IEEE Trans Pattern Anal 17(8):790\u2013799”,“journal title”:“IEEE Trans-Pattern Ana”},{“volume-title”:”模型选择和模型平均”,“年份”:“2008年”,“作者”:“G Claeskens”,“key”:“423_CR10”,“非结构化”:“Claeskens-G,Hjort N(2008)模型选择和建模平均。剑桥大学出版社,剑桥“},{“issue”:“1”,“key”:“423_CR11”,“doi asserted by”:“crossref”,“首页”:“1”,“doi”:“10.1111\/j.2517-6161.1977.tb01600.x”,“volume”:“39”,“author”:“A Dempster”,“year”:“1977”,“nonstructured”:“Dempster A,Laird N,Rubin D(1977)通过EM算法从不完整数据中获得最大似然。J R Stat Soc Ser B Stat Methodol 39(1):1\u201322“,”journal-title“:”J R Stat-Soc Ser B Stat Methodocl“},{“问题”:“2”,“关键”:“423_CR12”,”doi-asserted-by“:”publisher“,”first page“:”139“,“doi”:“10.1023\/A:100757513941”,“卷”:“40”,“作者”:“T Dietrich”,“年份”:“2000”,“非结构化”:“Dietrich-T(2000年)构建决策树集合的三种方法的实验比较:打包、增强和随机化。Mach Learn 40(2):139\u2013157“,“journal-title”:“Mach Learning”},{“key”:“423_CR13”,“unstructured”:“Duong T(2019)ks:Kernel Smoothing.R包版本1.11.4。https:\/\/CRAN.R-project.org\/package=ks。2019年8月访问“},{“key”:“423_CR14”,“unstructured”:“Fern XZ,Brodley CE(2003)《高维数据聚类的随机投影:集群集成方法》。In:第20届国际机器学习会议论文集,第186\u2013193页”},}“issue”:“2”,“key“:“423CR15”,“doi-asserted-by”:“publisher”,“first page”:”179“doi”:“10.1111\/j.1469-1809.1936.tb02137.x“,“volume”:“7”,“author”:“R Fisher”,“year”:“1936”,“unstructured”:“Fisher R(1936)分类问题中多重测量的使用。Ann Eugen 7(2):179\u2013188“,”journal-title“:”Ann Eugen“},{”issue“:”3“,”key“:”423_CR16“,”first page“:“189”,“volume”:“25”,”author“:”M Forina“,“year”:“1986”,“unstructured”:“Forina M,Armanino C,Castino M,Ubigli M(1986)多元数据分析作为葡萄酒原产地的判别方法。葡萄25(3):189\u2013201“,”journal-ttitle“:“葡萄”},{“issue”:“458”,“key”:“423_CR17”,“doi-asserted-by”:“publisher”,“first-page”:“611”,“doi”:“10.1198\/016214502760047131”,“volume”:”97“,“author”:“C Fraley”,“year”:“2002”,“unstructured”:“Fraley C,Raftery AE(2002)基于模型的聚类、判别分析和密度估计。J Am Stat Assoc 97(458):611\u2013631”,《新闻标题》:“J Am Stat Assoc”},{“volume-title”:“统计学习的要素”,“year”:“2001”,“author”:“J Friedman”,“key”:“423_CR18”,“unstructured”:“Friedmon J,Hastie T,Tibshirani R(2001)The elements of statistical learning。Springer,New York”}:“10.1109\/TIT.1975.1055330”,“volume”:“21”,“author”:“K Fukunaga”,“year”:“1975”,“unstructured”:“Fukunaka K,Hostetler L(1975)密度函数梯度的估计,及其在模式识别中的应用。IEEE Trans-Inform Theory 21(1):32\u201340”,“journal-title”:“IEEE Trans-Norm Theore”},{“issue”:“1”,“key”:”423_CR20“,“doi-asserted-by”:“publisher”,“first page”:“127”,”doi“:”10.1007\/s00180-012-0374-5“,”volume“:”28“,”author“:”M Glodek“,”year“:”2013“,”unstructured“:”Glodek M,Schels M,Schwenker F(2013)概率密度估计的集合高斯混合模型。Compute Stat 28(1):127\u2013138“,”journal-title“:”Compute Stat“},{“issue”:“1”,“key”:”423_C R21英寸,“doi-asserted-by”:“publisher”,“first page”:“3”,“doi”:“10.1007\/s11634-010-0058-3”,《volume》:“4”,“author”:“C Hennig”,“year”:“2010”,“unstructured”:“Hennig C(2010)合并高斯混合成分的方法。Adv Data Anal Classif 4(1):3\u201334”,“journal-title”:“Adv Data Analy Classif”},{“issue”:“1”,“key”:”423_CR22“doi-as serted-by“:”publisher“,“首页”:“193”,“DOI”:“10.1007\/BF01908075”,“卷”:“2”,“作者”:“L Hubert”,“年份”:“1985”,“非结构化”:“Hubert L,Arabie P(1985)比较分区。J Classif 2(1):193\u2013218”,“journal-title”:“J Classif”},{“key”:“423_CR23”,“DOI-asserted-by”:“crossref”,”非结构化:“Kuncheva L,Hadjitodorov S(2004)在集群群中使用多样性。2004年IEEE系统、人与控制论国际会议,第u00a02卷。IEEE,pp 1214\u20131219“,”DOI“:”10.1109\/ICSMC.2004.1399790“},{”issue“:”1“,”key“:”423_CR24“,”DOI-asserted-by“:”publisher“,”first page“:“21”,“DOI”:“10.1017\/S02660660550006”,“volume”:“21“,”author“:”H Leeb“,“year”:“2005”,”unstructured“:”Leeb H,P\u00f6tscher B(2005)模型选择与推理:事实与虚构。经济理论21(1):21\u201359“,”期刊标题“:”Econom Theory“},{”issue“:”3“,”key“:”423_CR25“,”doi asserted by“:”publisher“,”首页“:”547“,”doi“:”10.1198\/10618605X59586“,”卷“:”14“,”作者“:”J Li“,”年份“:”2005“,”非结构化“:”Li J(2005)基于多层混合模型的聚类。J Comput Graph Stat 14(3):547\u2013568“,”期刊标题“:”J Compute Graph Stat“},{”key“:”423_CR26“,”first page“:“1687”,“volume”:“8”,“author”:“J Li”,“year”:“2007”,“unstructured”:“Li J,Ray S,Lindsay B(2007)一种通过模式识别进行聚类的非参数统计方法。J Mach Learn Res 8:1687\u20131723”,“journal-title”:“J Mach Learn-Res”},}“issue”:“428”,”key:“423_CR2”,“doi-asserted-by”:“publisher,“首页”:“1535”,“DOI”:“10.1080\/01621459.1994.10476894”,“卷”:“89”,“作者”:“D Madigan”,“年份”:“1994”,“非结构化”:“MadiganD,Raftery AE(1994)模型选择和使用Occam\u2019s窗口计算图形模型中的模型不确定性。J Am Stat Assoc 89(428):1535\u20131546“,”journal-title“:”J Am Stat Assoc.“},{”issue“:”2“,”key“:”423_CR28“,”doi-asserted-by“:”publisher“,”first page“:“285”,”doi“:”10.1080\/10618600.2016.100472“,“volume”:“26”,“author”:“G Malsiner-Walli”,“year”:“2017”,“unstructured”:“Malsiner Walli G,Fr\u00fchw irth-Schnatter S,Gr\u00fcn B(2017)使用贝叶斯估计识别混合物。J Comput Graph Stat 26(2):285\u2013295“,”journal-title“:”J Computs Graph Stat.“},{”issue“:”3“,”key“:”423_CR29“,”doi-asserted-by“:”publisher“,”first page“:“413”,”doi“:”10.1111\/insr.12109“,”volume“:”84“,”author“:”G Menardi“,“year”:“2016”,“unstructured”:“Menardig G(2016)A review on modal clustering。国际统计年鉴84(3):413\u2013433“,“新闻标题”:”Int Stat Rev“},{“issue”:“1\u20132”,“key”:“423_CR30”,“doi-asserted-by”:“publisher”,“first page”::“91”,“doi”:“10.1023\/A:1023959509487”,“volume”:”52“,“author”:“S Monti”,“year”:“2003”,“unstructured”:“Monti S,Tamayo P,Mesirov J,Golub T(2003)共识聚类:一种基于重采样的方法,用于基因表达微阵列数据的类别发现和可视化。Mach Learn 52(1\u20132):91\u2013118“,”journal-title“:”Mach Learning“},{“key”:“423_CR31”,“unstructured”:“R Core Team(2019)R:统计计算的语言和环境。R Foundation for statistical computing,Vienna,Austria。https:\\/www.R-project.org\/.Accessed Aug 2019”},}“issue”:“3”,“key“423_CR32”,“doi-asserted-by”:“publisher”,“第一页“:“260”,“DOI”:“10.3103\/S10665307030052”,“volume”:“16”,“author”:“P Rigollet”,“year”:“2007”,“unstructured”:“Rigolet P,Tsybakov A(2007)密度估计量的线性和凸聚合。数学方法统计16(3):260\u2013280”,“期刊标题”:“数学方法统计”},{“key”:“423_CR33”,“unstructured”:“Russell N,Murphy TB,Raftery AE(2015)基于模型的聚类和密度估计中的贝叶斯模型平均。arXiv预印本arXiv:1506.09035”}、{“issue”:“2”,“key):“423CR34”,“doi-asserted-by”:“publisher”,”first page“461”,“doi”:“10.1214\/aos\/1176344136“,”volume“:”6“,”author“:”G Schwarz“,”year“:”1978“,”unstructured“:”Schwarz G(1978)Estimating the dimension of a model。Ann Stat 6(2):461\u2013464“,”journal-title“:”Ann Stat“},{“key”:“423_CR35”,“doi-asserted-by”:“publisher”,“doi”:“10.1002\/9781118575574”,“volume-title”:“多元密度估计:理论、实践和可视化”,“author”:“D Scott”,“year”:“2015”,“unstructured”:“Scott D(2015)多元密度估计:理论、实践和可视化。Wiley,New York“},{”key“:”423_CR36“,”doi-asserted-by“:”publisher“,”first page“:“5”,“doi”:“10.1016\/j.csda.2015.01.006”,“volume”:“93”,“author”:“L Scrucca”,“year”:“2016”,“unstructured”:“Scrucca-L(2016)识别高斯有限混合模型中用于聚类的连接成分。计算统计数据分析93:5\u201317”,“journal-title”:“”计算统计数据分析“},{“key”:“423_CR37”,“unstructured”:“Scrucca L(2020)高斯混合的一种快速高效的模态EM算法。arXiv预印本arXiv:2002.03600”},}“issue”:“4”,“key“:”423_CR18“,”doi-asserted-by“:”publisher“,”first page“:“447”,“doi”:“10.1007\/s11634-015-0220-z”,“volume”:”9“,“author”:“L Scrucca-”,“year”:“2015年”,“非结构化”:“Scrucca L,Raftery AE(2015)使用高斯分层分区改进了基于模型的聚类初始化。Adv Data Anal Classif 9(4):447\u2013460“,”journal-title“:”Adv Data Anal Classif“},{”issue“:”1“,”key“:”423_CR39“,”doi-asserted-by“:”publisher“,“first page”:“289”,“doi”:“10.32614\/RJ-2016-021”,“volume”:”8“,“author”:“L Scrucca”,“year”:“2016”,“unstructured”:“Scrucca-L,Fop M,Murphy TB,Raftery AE(2016)mclust 5:使用高斯有限混合模型进行聚类、分类和密度估计。R J 8(1):289“,”journal-title“:”R J“},{”issue“:”1\u20132“,”key“:”423_CR40“,”doi-asserted-by“:”publisher“,”first-page“:”59“,”doi“:”10.1023\/A:100751132260“,“volume”:“36”,“author”:“P Smyth”,“year”:“1999”,“unstructured”:“Smyth P,Wolpert D(1999)通过叠加线性组合密度估计器。Mach Learn 36(1\u20132):59\u201383“,“新闻标题”:”Mach Learn“},{”issue“:“9”,”key“:“423_CR41”,”doi-asserted-by“:”publisher“,”first page“:”727“,”doi“:”10.1002 \/cyto.a.22106“,”volume“:”81“,”author“:”J Spiden“,”year“:”2012“,”unstructured“:”Spiden J,Breuer K,Rosenberg C,Kotecha N,Brinkman R(2012)Flowrepository:与同行评审出版物相关的注释流式细胞术数据集资源。Cytom Part A 81(9):727\u2013731“,”journal-title“:”Cytom Part A“},{“key”:“423_CR42”,“first page”:”583“,”volume“:”3“,“author”:“A Strehl”,“year”:“2002”,“unstructured”:“Strehl A,Ghosh J(2002)Cluster ensemples\u2014a knowledge reuse framework for combinding multiple partitions.J Mach Learn Res 3:583\u2013617”,“journal-title”:“J Mach Learn Res”},{“issue“:”1“,”key“:”423_CR43“,”doi-asserted-by“:”publisher“,”first-pages“:”025“,”doi“:”10.1007\/s00357-003-0004-6“,”volume“:“20”,”author“:”W-Stuetzle“,”year“:”2003“,”unstructured“:”Stuetzle W(2003)通过分析样本的最小生成树来估计密度的簇树。J Classif 20(1):025\u2013047“,“journal-title”:“J Classif”},{“volume-title“:“稀疏的统计学习:套索和概括”,“year”:“2015”,“author”:“R Tibshirani”,“key”:“423_CR44”,“unstructured”:“Tibshilani R,Wainwright M,Hastie T(2015)稀疏性统计学习:套索和概括。查普曼和霍尔,伦敦“},{“问题”:“1”,“关键”:“423_CR45”,“doi-asserted-by”:“出版商”,“首页”:“43”,“doi”:“10.1007\/s1122-017-9793-z”,“卷”:“29”,“作者”:“C Viroli”,“年份”:“2019”,“非结构化”:“Viroli C,McLachlan G(2019)深高斯混合模型。统计计算29(1):43\u201351”,“日志标题”:“统计计算“}”,{“键”:“423_CR46”,“非结构化”:“Wang K,Ng A,McLachlan G(2018)EMMIXSew:EM算法和斜交混合分布。https:\/\/CRAN.R-project.org\/package=EMMIXSew。R package version 1.0.3“},{“issue”:“2”,“key”:“423_CR47”,“doi-asserted-by”:“publisher”,“first page”:”197“,“doi”:“10.1007\/s11634-014-018-0182-6”,“volume”:“9”,“author”:“Y Wei”,“year”:“2015”,“unstructured”:“Wei Y,McNicholas PD(2015)聚类的混合模型平均值。Adv Data Anal Classif 9(2):197\u2013217”,“journal-title”:“Adv Data分析类“}],“container-title”:[“Advances in Data Analysis and Classification”],“原始标题”:[],“language”:“en”,“link”:[{“URL”:“https:\/\/link.springer.com/content\/pdf\/10.1007\/s11634-020-00423-6.pdf”,“content-type”:“application\/pdf”、“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\/\/link.springer.com/article\/10.1007\/s11634-020-00423-6\/fulltext.html”,“content-type”:“text\/html”,“内容-版本”:“vor”,“intended-application”:“文本-分钟”},{“URL”:“http:\/\-link.springer.com/content\/pdf\/10.10007\/s11634.020-00423-6.pdf”d-应用程序“:“相似性检查”}],“存放”:{“日期部分”:[[2024,8,15]],“日期时间”:“2024-08-15T10:41:11Z”,“时间戳”:1723718471000},“分数”:1,“资源”:{primary“:{”URL“:”https:\/\/link.springer.com/10.1007\/s11634-020-00423-6“}}”,“副标题”:[],“短标题”:[],“已发布”:{“日期部分“:[2020,10,2,2]]},“references-count”:47,“journal-issue”:{“issue”:“3”,“published-print”:{“date-parts”:[[2021,9]]}},“alternative-id”:[“423”],“URL”:“http://\/dx.doi.org\/10.1007\/s11634-020-00423-6”,“relation”:{},”ISSN“:[“1862-5347”,“1862-555”],”ISSN-type“:[{”type“:”print“,”value“:”1862-5347},{“type”:“electronic”,“value”:2-5355“}],“主题”:[],“发布”:{“日期部分”:[[2020,10,2]]},“断言”:[{“值”:“2020年3月6日”,“订单”:1,“名称”:“已收到”,“标签”:“收到”,”组“:{“姓名”:“文章历史”,“label”:“物品历史”}},{“值”:“2020月24日”,”订单“:2,“名称“:”修订“,”标签“:”修改“,”组”:{名称“:“文章史”,”标签,“组”:{“名称”:“Article History”,“label”:“文章历史”}},{“value”:“2020年10月2日”,“order”:4,“name”:“first_online”,“标签”:“首次在线”,“group”:{“name”:“ArticleHistory“,”label“:”文章历史“}}、{“order:“作者声明他们没有利益冲突。”,“order”:2,“name”:“Ethics”,“group”:{“name”:“EthicsHeading”,“label”:“利益冲突”}}]}}