{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期-部件”：[[2024,8,15]]，“日期-时间”：“2024-08-15T11:10:30Z”，“时间戳”：1723720230683}，“参考-计数”：47，“出版商”：“Springer Science and Business Media LLC”，“问题”：“3”，“许可证”：[{“开始”：}“日期-零件”：[2020,10,2]]，“时间”：“2020-10-02T00:00:00Z”，“timestamp”：1601596800000}，“content-version”：“tdm”，“delay-in-days”：0，“URL”：“https:\/\/creativecommons.org\/licenses\/by\/4.0”}，{“start”：{“date-parts”：[[2020,10,2]，“date-time”：“2020-10-02T00:00:00Z”，“timetamp”：16001596800000neneneep，“content-version”：“vor”，“delay-in-days”：“0，”URL“https:\\/creativecommons.org\/licenses\/by\/4.0“}]，“出资人”：[{“DOI”：“10.13039\/501100003500”，“name”：“Universit\u00e0 degli Studi di Padova”，“doi-asserted-by”：“crossref”，”id“：[{“id”：“10.13029\/5011000003500”，“id-type”：“doi”，“asserted-by”：“crassref”}]]，“content-domain”：{“domain”:[“link.springer.com”]，“crossmark-restriction”：false}，“short-container-title”：[“Adv Data Anal Classif”“]，”published-print“：{”date-parts“：[[2021,9]]}，“摘要”：“摘要<\/jats:title>随着最近数据可用性和复杂性的增长，以及复杂建模方法的爆发，模型选择工具已成为一条生命线，为应对这一日益具有挑战性的形势提供了客观标准。事实上，基于单一模型的预测和推断即使无害，也可能是有限的；集成方法结合了不同的模型，被提出来克服选择步骤，并被证明是卓有成效的，特别是在有监督的学习框架中。相反，这些方法在无监督的环境中很少被探索。在这项工作中，我们将重点放在基于模型的聚类公式上，其中通常估计了具有不同数量组件和参数化的大量混合模型。我们提出了一种集成聚类方法，它绕过了单一最佳模型范式，同时提高了分区的稳定性和健壮性。引入了一种新的密度估计量，它是集合中密度估计量的凸线性组合，并将其用于群分配。与标准情况不同，集群通常与所选混合模型的组件相关联，我们通过借用集群问题的模式或非参数公式来定义分区，其中组与高密度区域相关联。因此，在基于密度的领域中，我们展示了从聚类的角度来看，将参数和非参数方法混合在一起是如何有益的<\/jats:p>“，”DOI“：”10.1007\/s11634-020-00423-6“，”type“：”journal-article“，”created“：{”date-parts“：[[2020,10,2]，”date-time“：”2020-10-02T07:02:58Z“，”timestamp“：1601622178000}，”page“：referenced-by-count“：4，”title“：[“比最好的更好？通过基于密度聚类中的模型集合回答“]，”前缀“：”10.1007“，”卷“：”15“，”作者“：[{”ORCID“：”http://\/ORCID.org\/0000-0002-2929-3850“，”authenticated-ORCID“：false，”给定“：”Alessandro“，”家族“：”Casa“，”序列“：”first“，”affiliation“：[]}，”给定的“：”Luca“，”家庭“：”Scrucca“，“sequence”：“additional”，“afliation”：[]{，{“给定”：Giovanna“，”family“：”Menardi“，”sequence“：”additional“，”affiliation“：[]}]，”member“：”297“，”published-on-line“：{”date-parts“：[2020,10,2]}，”reference“：[{”issue“：”3“，”key“：”423_CR1“，“doi-asserted-by”：“publisher”，“first page”：“228”，“doi”：“10.1038\/nmeth.2365”，”volume“：“10”，“author”：“”N Aghaeepour”，“年份”：“2013年”，“非结构化”：“Aghaeepour N、Finak G、Hoos H、Mosmann T、Brinkman R、Gottardo R、Scheuermann R、FlowCAP Consortium、DREAM Consortius（2013）自动化流式细胞术数据分析技术的关键评估。Nat Methods 10（3）：228“，”journal-title“：”Nat Methods“}，{”issue“：”4“，”key“：”423_CR2“，”doi-asserted-by“：”publisher“，”first page“：“715”，”doi“：”10.1093/biomet\/83.4.715“，”volume“：）：715\u2013726“，”journal-title“：“Biometrika”}，{“key”：“423_CR3”，“doi-asserted-by”：“crossref”，“unstructured”：“Banfield J，Raftery AE（1993）基于模型的高斯和非高斯聚类。生物统计学49（3）：803\u2013821”，“doi”：“10.2307\/2532201”}198\/jcgs.2010.08111“，”卷“：”19“，”author“：”JP Baudry“，”year“：”2010“，”unstructured“：”Baudry JP，Raftery AE，Celeux G，Lo K，Gottardo R（2010）组合混合成分进行聚类。J Comput Graph Stat 19（2）：332\u2013353“，”journal-title“：”J Comput-Graph Stat“}，{“issue”：“7”，“key”：“423_CR5”，“doi-asserted-by”：“publisher”，“first-page”：“719”，“doi”：“10.1109\/34.86 5189“，”volume“：”22“，”author“：”C Biernacki“，”year“：”2000“，”unstructured“：”Biernackei C，Celeux G，Govaert G（2000）用综合完全似然评估聚类的混合模型。IEEE T Pattern Anal 22（7）:719\u2013725”，“期刊标题”：“IEEE T Pattern Anal”}，｛“issue”：“5”，“key”：“423_CR6”，“doi断言”：“publisher”，“首页”：“781”，“doi”：“10.1016\/001-3203（94）00125-6”，“volume”：“28”，“author”：“G Celeux”，“year”：“1995”，“nonstructured”：“Celeux G，Govaert G（1995）高斯简约聚类模型。模式识别器28（5）：781\u2013793“，”journal-title“：”Pattern Recognit“}，{”issue“：”2“，”key“：”423_CR7“，”doi-asserted-by“：”publisher“，”first page“：“379”，”doi“：”10.1007\/s11634-018-0308-3“，”volume“：Classif 13（2）：379\u2013404“，”新闻标题“：”Adv Data Anal Classif“}，{“key”：“423_CR8”，“doi-asserted-by”：“publisher”，“doi”：“10.1201\/9780429485572”，“volume-title”：“多元核平滑及其应用”，“author”：“JE Chac\u00f3n”，“year”：“2018”，“unstructured”：“Chac\u 00f3n-JE，Duong T（2018）多元核平滑及应用。Chapman and Hall，CRC，伦敦”}，}“issue“：”8“，”key“：”423_CR9“，”doi-asserted-by“：”publisher“，”first page“：“790”，”doi“：”10.1109\/34.400568“，“volume”：“17”，“author”：“Y Cheng”，“year”：“1995”，“unstructured”：“Cheng Y（1995）Mean shift，mode searching，and clustering。IEEE Trans Pattern Anal 17（8）：790\u2013799”，“journal title”：“IEEE Trans-Pattern Ana”}，{“volume-title”：”模型选择和模型平均”，“年份”：“2008年”，“作者”：“G Claeskens”，“key”：“423_CR10”，“非结构化”：“Claeskens-G，Hjort N（2008）模型选择和建模平均。剑桥大学出版社，剑桥“｝，｛“issue”：“1”，“key”：“423_CR11”，“doi asserted by”：“crossref”，“首页”：“1”，“doi”：“10.1111\/j.2517-6161.1977.tb01600.x”，“volume”：“39”，“author”：“A Dempster”，“year”：“1977”，“nonstructured”：“Dempster A，Laird N，Rubin D（1977）通过EM算法从不完整数据中获得最大似然。J R Stat Soc Ser B Stat Methodol 39（1）：1\u201322“，”journal-title“：”J R Stat-Soc Ser B Stat Methodocl“}，{“问题”：“2”，“关键”：“423_CR12”，”doi-asserted-by“：”publisher“，”first page“：”139“，“doi”：“10.1023\/A:100757513941”，“卷”：“40”，“作者”：“T Dietrich”，“年份”：“2000”，“非结构化”：“Dietrich-T（2000年）构建决策树集合的三种方法的实验比较：打包、增强和随机化。Mach Learn 40（2）：139\u2013157“，“journal-title”：“Mach Learning”}，{“key”：“423_CR13”，“unstructured”：“Duong T（2019）ks:Kernel Smoothing.R包版本1.11.4。https:\/\/CRAN.R-project.org\/package=ks。2019年8月访问“}，{“key”：“423_CR14”，“unstructured”：“Fern XZ，Brodley CE（2003）《高维数据聚类的随机投影：集群集成方法》。In:第20届国际机器学习会议论文集，第186\u2013193页”}，}“issue”：“2”，“key“：“423CR15”，“doi-asserted-by”：“publisher”，“first page”：”179“doi”：“10.1111\/j.1469-1809.1936.tb02137.x“，“volume”：“7”，“author”：“R Fisher”，“year”：“1936”，“unstructured”：“Fisher R（1936）分类问题中多重测量的使用。Ann Eugen 7（2）：179\u2013188“，”journal-title“：”Ann Eugen“}，{”issue“：”3“，”key“：”423_CR16“，”first page“：“189”，“volume”：“25”，”author“：”M Forina“，“year”：“1986”，“unstructured”：“Forina M，Armanino C，Castino M，Ubigli M（1986）多元数据分析作为葡萄酒原产地的判别方法。葡萄25（3）：189\u2013201“，”journal-ttitle“：“葡萄”}，{“issue”：“458”，“key”：“423_CR17”，“doi-asserted-by”：“publisher”，“first-page”：“611”，“doi”：“10.1198\/016214502760047131”，“volume”：”97“，“author”：“C Fraley”，“year”：“2002”，“unstructured”：“Fraley C，Raftery AE（2002）基于模型的聚类、判别分析和密度估计。J Am Stat Assoc 97（458）：611\u2013631”，《新闻标题》：“J Am Stat Assoc”}，{“volume-title”：“统计学习的要素”，“year”：“2001”，“author”：“J Friedman”，“key”：“423_CR18”，“unstructured”：“Friedmon J，Hastie T，Tibshirani R（2001）The elements of statistical learning。Springer，New York”}：“10.1109\/TIT.1975.1055330”，“volume”：“21”，“author”：“K Fukunaga”，“year”：“1975”，“unstructured”：“Fukunaka K，Hostetler L（1975）密度函数梯度的估计，及其在模式识别中的应用。IEEE Trans-Inform Theory 21（1）：32\u201340”，“journal-title”：“IEEE Trans-Norm Theore”}，{“issue”：“1”，“key”：”423_CR20“，“doi-asserted-by”：“publisher”，“first page”：“127”，”doi“：”10.1007\/s00180-012-0374-5“，”volume“：”28“，”author“：”M Glodek“，”year“：”2013“，”unstructured“：”Glodek M，Schels M，Schwenker F（2013）概率密度估计的集合高斯混合模型。Compute Stat 28（1）：127\u2013138“，”journal-title“：”Compute Stat“}，{“issue”：“1”，“key”：”423_C R21英寸，“doi-asserted-by”：“publisher”，“first page”：“3”，“doi”：“10.1007\/s11634-010-0058-3”，《volume》：“4”，“author”：“C Hennig”，“year”：“2010”，“unstructured”：“Hennig C（2010）合并高斯混合成分的方法。Adv Data Anal Classif 4（1）：3\u201334”，“journal-title”：“Adv Data Analy Classif”}，{“issue”：“1”，“key”：”423_CR22“doi-as serted-by“：”publisher“，“首页”：“193”，“DOI”：“10.1007\/BF01908075”，“卷”：“2”，“作者”：“L Hubert”，“年份”：“1985”，“非结构化”：“Hubert L，Arabie P（1985）比较分区。J Classif 2（1）：193\u2013218”，“journal-title”：“J Classif”}，{“key”：“423_CR23”，“DOI-asserted-by”：“crossref”，”非结构化：“Kuncheva L，Hadjitodorov S（2004）在集群群中使用多样性。2004年IEEE系统、人与控制论国际会议，第u00a02卷。IEEE，pp 1214\u20131219“，”DOI“：”10.1109\/ICSMC.2004.1399790“}，{”issue“：”1“，”key“：”423_CR24“，”DOI-asserted-by“：”publisher“，”first page“：“21”，“DOI”：“10.1017\/S02660660550006”，“volume”：“21“，”author“：”H Leeb“，“year”：“2005”，”unstructured“：”Leeb H，P\u00f6tscher B（2005）模型选择与推理：事实与虚构。经济理论21（1）：21\u201359“，”期刊标题“：”Econom Theory“｝，｛”issue“：”3“，”key“：”423_CR25“，”doi asserted by“：”publisher“，”首页“：”547“，”doi“：”10.1198\/10618605X59586“，”卷“：”14“，”作者“：”J Li“，”年份“：”2005“，”非结构化“：”Li J（2005）基于多层混合模型的聚类。J Comput Graph Stat 14（3）:547\u2013568“，”期刊标题“：”J Compute Graph Stat“}，{”key“：”423_CR26“，”first page“：“1687”，“volume”：“8”，“author”：“J Li”，“year”：“2007”，“unstructured”：“Li J，Ray S，Lindsay B（2007）一种通过模式识别进行聚类的非参数统计方法。J Mach Learn Res 8:1687\u20131723”，“journal-title”：“J Mach Learn-Res”}，}“issue”：“428”，”key：“423_CR2”，“doi-asserted-by”：“publisher，“首页”：“1535”，“DOI”：“10.1080\/01621459.1994.10476894”，“卷”：“89”，“作者”：“D Madigan”，“年份”：“1994”，“非结构化”：“MadiganD，Raftery AE（1994）模型选择和使用Occam\u2019s窗口计算图形模型中的模型不确定性。J Am Stat Assoc 89（428）：1535\u20131546“，”journal-title“：”J Am Stat Assoc.“}，{”issue“：”2“，”key“：”423_CR28“，”doi-asserted-by“：”publisher“，”first page“：“285”，”doi“：”10.1080\/10618600.2016.100472“，“volume”：“26”，“author”：“G Malsiner-Walli”，“year”：“2017”，“unstructured”：“Malsiner Walli G，Fr\u00fchw irth-Schnatter S，Gr\u00fcn B（2017）使用贝叶斯估计识别混合物。J Comput Graph Stat 26（2）：285\u2013295“，”journal-title“：”J Computs Graph Stat.“}，{”issue“：”3“，”key“：”423_CR29“，”doi-asserted-by“：”publisher“，”first page“：“413”，”doi“：”10.1111\/insr.12109“，”volume“:”84“，”author“：”G Menardi“，“year”：“2016”，“unstructured”：“Menardig G（2016）A review on modal clustering。国际统计年鉴84（3）：413\u2013433“，“新闻标题”：”Int Stat Rev“}，{“issue”：“1\u20132”，“key”：“423_CR30”，“doi-asserted-by”：“publisher”，“first page”：：“91”，“doi”：“10.1023\/A:1023959509487”，“volume”：”52“，“author”：“S Monti”，“year”：“2003”，“unstructured”：“Monti S，Tamayo P，Mesirov J，Golub T（2003）共识聚类：一种基于重采样的方法，用于基因表达微阵列数据的类别发现和可视化。Mach Learn 52（1\u20132）：91\u2013118“，”journal-title“：”Mach Learning“}，{“key”：“423_CR31”，“unstructured”：“R Core Team（2019）R:统计计算的语言和环境。R Foundation for statistical computing，Vienna，Austria。https:\\/www.R-project.org\/.Accessed Aug 2019”}，}“issue”：“3”，“key“423_CR32”，“doi-asserted-by”：“publisher”，“第一页“：“260”，“DOI”：“10.3103\/S10665307030052”，“volume”：“16”，“author”：“P Rigollet”，“year”：“2007”，“unstructured”：“Rigolet P，Tsybakov A（2007）密度估计量的线性和凸聚合。数学方法统计16（3）：260\u2013280”，“期刊标题”：“数学方法统计”}，{“key”：“423_CR33”，“unstructured”：“Russell N，Murphy TB，Raftery AE（2015）基于模型的聚类和密度估计中的贝叶斯模型平均。arXiv预印本arXiv:1506.09035”}、{“issue”：“2”，“key）：“423CR34”，“doi-asserted-by”：“publisher”，”first page“461”，“doi”：“10.1214\/aos\/1176344136“，”volume“：”6“，”author“：”G Schwarz“，”year“：”1978“，”unstructured“：”Schwarz G（1978）Estimating the dimension of a model。Ann Stat 6（2）：461\u2013464“，”journal-title“：”Ann Stat“}，{“key”：“423_CR35”，“doi-asserted-by”：“publisher”，“doi”：“10.1002\/9781118575574”，“volume-title”：“多元密度估计：理论、实践和可视化”，“author”：“D Scott”，“year”：“2015”，“unstructured”：“Scott D（2015）多元密度估计：理论、实践和可视化。Wiley，New York“}，{”key“：”423_CR36“，”doi-asserted-by“：”publisher“，”first page“：“5”，“doi”：“10.1016\/j.csda.2015.01.006”，“volume”：“93”，“author”：“L Scrucca”，“year”：“2016”，“unstructured”：“Scrucca-L（2016）识别高斯有限混合模型中用于聚类的连接成分。计算统计数据分析93:5\u201317”，“journal-title”：“”计算统计数据分析“}，{“key”：“423_CR37”，“unstructured”：“Scrucca L（2020）高斯混合的一种快速高效的模态EM算法。arXiv预印本arXiv:2002.03600”}，}“issue”：“4”，“key“：”423_CR18“，”doi-asserted-by“：”publisher“，”first page“：“447”，“doi”：“10.1007\/s11634-015-0220-z”，“volume”：”9“，“author”：“L Scrucca-”，“year”：“2015年”，“非结构化”：“Scrucca L，Raftery AE（2015）使用高斯分层分区改进了基于模型的聚类初始化。Adv Data Anal Classif 9（4）：447\u2013460“，”journal-title“：”Adv Data Anal Classif“}，{”issue“：”1“，”key“：”423_CR39“，”doi-asserted-by“：”publisher“，“first page”：“289”，“doi”：“10.32614\/RJ-2016-021”，“volume”：”8“，“author”：“L Scrucca”，“year”：“2016”，“unstructured”：“Scrucca-L，Fop M，Murphy TB，Raftery AE（2016）mclust 5：使用高斯有限混合模型进行聚类、分类和密度估计。R J 8（1）：289“，”journal-title“：”R J“}，{”issue“：”1\u20132“，”key“：”423_CR40“，”doi-asserted-by“：”publisher“，”first-page“：”59“，”doi“：”10.1023\/A:100751132260“，“volume”：“36”，“author”：“P Smyth”，“year”：“1999”，“unstructured”：“Smyth P，Wolpert D（1999）通过叠加线性组合密度估计器。Mach Learn 36（1\u20132）:59\u201383“，“新闻标题”：”Mach Learn“}，{”issue“：“9”，”key“：“423_CR41”，”doi-asserted-by“：”publisher“，”first page“：”727“，”doi“：”10.1002 \/cyto.a.22106“，”volume“:”81“，”author“：”J Spiden“，”year“：”2012“，”unstructured“：”Spiden J，Breuer K，Rosenberg C，Kotecha N，Brinkman R（2012）Flowrepository：与同行评审出版物相关的注释流式细胞术数据集资源。Cytom Part A 81（9）：727\u2013731“，”journal-title“：”Cytom Part A“}，{“key”：“423_CR42”，“first page”：”583“，”volume“：”3“，“author”：“A Strehl”，“year”：“2002”，“unstructured”：“Strehl A，Ghosh J（2002）Cluster ensemples\u2014a knowledge reuse framework for combinding multiple partitions.J Mach Learn Res 3:583\u2013617”，“journal-title”：“J Mach Learn Res”}，{“issue“：”1“，”key“：”423_CR43“，”doi-asserted-by“：”publisher“，”first-pages“：”025“，”doi“：”10.1007\/s00357-003-0004-6“，”volume“：“20”，”author“：”W-Stuetzle“，”year“：”2003“，”unstructured“：”Stuetzle W（2003）通过分析样本的最小生成树来估计密度的簇树。J Classif 20（1）：025\u2013047“，“journal-title”：“J Classif”}，{“volume-title“：“稀疏的统计学习：套索和概括”，“year”：“2015”，“author”：“R Tibshirani”，“key”：“423_CR44”，“unstructured”：“Tibshilani R，Wainwright M，Hastie T（2015）稀疏性统计学习：套索和概括。查普曼和霍尔，伦敦“}，{“问题”：“1”，“关键”：“423_CR45”，“doi-asserted-by”：“出版商”，“首页”：“43”，“doi”：“10.1007\/s1122-017-9793-z”，“卷”：“29”，“作者”：“C Viroli”，“年份”：“2019”，“非结构化”：“Viroli C，McLachlan G（2019）深高斯混合模型。统计计算29（1）：43\u201351”，“日志标题”：“统计计算“}”，{“键”：“423_CR46”，“非结构化”：“Wang K，Ng A，McLachlan G（2018）EMMIXSew:EM算法和斜交混合分布。https:\/\/CRAN.R-project.org\/package=EMMIXSew。R package version 1.0.3“}，{“issue”：“2”，“key”：“423_CR47”，“doi-asserted-by”：“publisher”，“first page”：”197“，“doi”：“10.1007\/s11634-014-018-0182-6”，“volume”:“9”，“author”：“Y Wei”，“year”：“2015”，“unstructured”：“Wei Y，McNicholas PD（2015）聚类的混合模型平均值。Adv Data Anal Classif 9（2）：197\u2013217”，“journal-title”：“Adv Data分析类“}]，“container-title”：[“Advances in Data Analysis and Classification”]，“原始标题”：[]，“language”：“en”，“link”：[{“URL”：“https:\/\/link.springer.com/content\/pdf\/10.1007\/s11634-020-00423-6.pdf”，“content-type”：“application\/pdf”、“content-version”：“vor”，“intended-application”：“text-mining”}，{“URL”：“https:\/\/link.springer.com/article\/10.1007\/s11634-020-00423-6\/fulltext.html”，“content-type”：“text\/html”，“内容-版本”：“vor”，“intended-application”：“文本-分钟”}，{“URL”：“http:\/\-link.springer.com/content\/pdf\/10.10007\/s11634.020-00423-6.pdf”d-应用程序“：“相似性检查”}]，“存放”：{“日期部分”：[[2024,8,15]]，“日期时间”：“2024-08-15T10:41:11Z”，“时间戳”：1723718471000}，“分数”：1，“资源”：{primary“：{”URL“：”https:\/\/link.springer.com/10.1007\/s11634-020-00423-6“}}”，“副标题”：[]，“短标题”：[]，“已发布”：{“日期部分“：[2020,10,2,2]]}，“references-count”：47，“journal-issue”：{“issue”：“3”，“published-print”：{“date-parts”：[[2021,9]]}}，“alternative-id”：[“423”]，“URL”：“http://\/dx.doi.org\/10.1007\/s11634-020-00423-6”，“relation”：{}，”ISSN“：[“1862-5347”，“1862-555”]，”ISSN-type“：[{”type“:”print“，”value“：”1862-5347}，{“type”：“electronic”，“value”：2-5355“}]，“主题”：[]，“发布”：{“日期部分”：[[2020,10,2]]}，“断言”：[{“值”：“2020年3月6日”，“订单”：1，“名称”：“已收到”，“标签”：“收到”，”组“：{“姓名”：“文章历史”，“label”：“物品历史”}}，{“值”：“2020月24日”，”订单“：2，“名称“：”修订“，”标签“：”修改“，”组”：{名称“：“文章史”，”标签，“组”：{“名称”：“Article History”，“label”：“文章历史”}}，{“value”：“2020年10月2日”，“order”：4，“name”：“first_online”，“标签”：“首次在线”，“group”：{“name”:“ArticleHistory“，”label“：”文章历史“}}、{“order：“作者声明他们没有利益冲突。”，“order”：2，“name”：“Ethics”，“group”：{“name”:“EthicsHeading”，“label”：“利益冲突”}}]}}