×

多元高斯混合模型的延拓方法和核密度估计。 (英语) Zbl 1339.60012号

摘要:高斯混合(即多元高斯概率密度的线性组合)因其逼近多峰概率分布的通用能力而出现在许多应用中。在机器学习和数字图像处理等许多实际应用中,找到高斯混合的模式(最大值)是一个基本问题。在本文中,我们提出了一种计算效率高的方法来寻找高斯混合的有效模式。这种模式代表了一个概率较大的区域,它通常与混合的全局模式一致。所提出的方法使用高斯卷积来去除高斯混合的不期望的局部最大值并保留其基本结构。平滑高斯混合函数的最大值与原始最大值之间的转换被表示为微分方程。描述了一种跟踪该微分方程解曲线的鲁棒信赖域方法。我们的公式还允许负重量甚至负值的混合物,这在与机器学习或量子力学相关的一些应用中会发生。说明了该方法对从实验数据中获得的高斯核密度估计模型的适用性。最后,给出了一些数值结果,以证明该方法能够找到高斯混合的有效模式和核密度估计。

MSC公司:

60E05型 概率分布:一般理论
62G07年 密度估算
68T05年 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abramowitz M.,Stegun I.:《数学函数手册》。纽约多佛(1964)·Zbl 0171.38503号
[2] Allgover E.L.,Georg K.:《数值延拓方法:导论》。柏林施普林格(1990)·Zbl 0717.65030号 ·doi:10.1007/978-3-642-61257-2
[3] Bishop C.M.、Svensén M.、Williams C.K.I.:GTM:生成性地形图。神经计算。10(1), 215-234 (1998) ·doi:10.1162/08997669830017953
[4] Carreira-Perpiñán,M.A.:用概率模型和连续性约束重建序列数据。收录:Solla,S.A.、Leen,T.K.、Müller,K.R.(编辑)《神经信息处理系统进展》,第12卷,第414-420页(1999)
[5] Carreira-Perpiñán M.A.:高斯分布混合物的模态发现。IEEE传输。模式分析。机器。因特尔。22(11), 1318-1323 (2000) ·Zbl 0960.65038号 ·数字标识代码:10.1109/34.888716
[6] Carreira-Perpiñán,M.A.,Renals,S.:声-发音映射问题的潜在变量建模方法。收录于:Ohala,J.J.、Hasegawa,Y.、Ohala、M.、Granville,D.、Bailey,A.C.(编辑)第十四届国际语音科学大会(ICPhS'99),pp.2013-2016(1999)
[7] Chaudhuri P.,Marron J.S.:曲线结构勘探的尺寸。《美国统计协会期刊》94(447),807-823(1999)·Zbl 1072.62556号 ·doi:10.1080/01621459.1999.10474186
[8] 程毅:均值转移、模式寻找和聚类。模式分析。机器。因特尔。17(8), 790-799 (1995) ·数字对象标识代码:10.1109/34.400568
[9] Duong T.,Hazelton M.L.:多元核密度估计的交叉验证带宽矩阵。扫描。《美国联邦法律大全》第32卷第3期,第485-506页(2005年)·兹比尔1089.62035 ·doi:10.1111/j.1467-9469.2005.00445.x
[10] Enzweiler,M.,Gavrila,D.M.:综合行人分类和方向估计。摘自:IEEE计算机视觉和模式识别会议,第982-989页(2010年)
[11] Fan J.,Yao Q.:非线性时间序列:非参数和参数方法。柏林施普林格出版社(2005)
[12] Hall P.、Sheather S.J.、Jones M.C.、Marron J.S.:关于核密度估计中基于数据的最佳带宽选择。生物医学78(2),263-269(1991)·Zbl 0733.62045号 ·doi:10.1093/biomet/78.2.263
[13] Han B.,Davis L.:用于对象跟踪的基于密度的在线外观建模。第十届IEEE国际协调计算。视觉。21492年-1499年(2005年)
[14] Hartle J.B.:具有扩展概率的量子力学。物理学。修订版A 78(1),1-13(2008)·Zbl 1255.81015号 ·doi:10.1103/PhysRevA.78.012108
[15] Horn R.A.、Johnson C.R.:矩阵分析。剑桥大学出版社,剑桥(1985)·Zbl 0576.15001号 ·doi:10.1017/CBO9780511810817
[16] Härdle W.,Müller M.,Sperlich S.,Wervatz A.:非参数和半参数模型。统计学中的斯普林格系列。施普林格,柏林(2004)·Zbl 1059.62032号 ·doi:10.1007/978-3-642-17146-8
[17] Jain A.K.,Duin R.P.W.,Mao J.:统计模式识别:综述。IEEE传输。模式分析。机器。因特尔。22(1), 4-37 (2000) ·doi:10.1109/34.824819
[18] Jones D.R.、Schonlau M.、Welch W.J.:昂贵黑盒函数的高效全局优化。J.全球。最佳方案。13(4), 455-492 (1998) ·Zbl 0917.90270号 ·doi:10.1023/A:1008306431147
[19] Jones M.C.、Marron J.S.、Sheather S.J.:密度估算带宽选择的简要调查。《美国统计协会期刊》91(433),401-407(1996)·Zbl 0873.62040号 ·doi:10.1080/01621459.1996.10476701
[20] 科赫·W。:关于跟踪和传感器数据融合中的“负面”信息:选定示例的讨论。第七届国际会议信息融合2,1-20(2004)
[21] Marron J.S.,Wand M.P.:精确平均积分平方误差。Ann.Stat.20(2),712-736(1992)·Zbl 0746.62040号 ·doi:10.1214/aos/1176348653
[22] MoréJ.J.,Wu Z.:距离几何问题的全局延拓。SIAM J.Optim公司。7(3), 814-836 (1997) ·Zbl 0891.90168号 ·doi:10.1137/S1052623495283024
[23] Mückenheim W.、Ludwig G.、Dewdney C.、Holland P.R、Kyprianidis A.、Vigier J.P.、Petroni N.C.、Bartlett M.S.、Jaynes E.T.:扩展概率综述。物理学。代表133(6),337-401(1986)·doi:10.1016/0370-1573(86)90110-9
[24] Nocedal J.,Wright S.J.:《数值优化》,第二版。施普林格,纽约(2006)·Zbl 1104.65059号
[25] Paris,S.,Durand,F.:使用均值偏移进行分层分割的拓扑方法。摘自:IEEE计算机视觉和模式识别会议,第1-8页(2007年)
[26] Scott D.W.:多元密度估算:理论实践与可视化。威利,纽约(1992)·Zbl 0850.62006号 ·数字对象标识代码:10.1002/9780470316849
[27] Sheather S.J.,Jones M.C.:用于核密度估计的可靠的基于数据的带宽选择方法。J.R.统计社会服务。B(方法学)53(3),683-690(1991)·Zbl 0800.62219
[28] Shen C.,Brooks M.J.,van den Hengel A.:快速全球核密度模式搜索:定位和跟踪应用。IEEE传输。图像处理。16(5), 1457-1469 (2007) ·doi:10.1109/TIP.2007.894233
[29] Silverman B.W.:统计和数据分析的密度估计。查普曼和霍尔,伦敦(1986年)·Zbl 0617.62042号
[30] Steihaug T.:共轭梯度法和大规模优化中的信赖域。SIAM J.数字。分析。20(3), 626-637 (1983) ·Zbl 0518.65042号 ·doi:10.1137/0720042
[31] Stewart G.W.:矩阵算法,第二卷:特征系统。SIAM,费城(2001)·Zbl 0984.65031号 ·数字对象标识代码:10.1137/1.9780898718058
[32] Titterington D.M.、Smith A.F.M.、Makov U.E.:有限混合分布的统计分析。奇切斯特·威利(1985)·Zbl 0646.62013.中
[33] Wand M.P.,Jones M.C.:内核平滑。查普曼和霍尔,伦敦(1995年)·Zbl 0854.62043号
[34] 吴忠:有效能量转换方案是全局优化的一种特殊延续方法,应用于分子构象。SIAM J.Optim公司。6(3), 748-768 (1996) ·Zbl 0868.90116号 ·doi:10.1137/S105262349393254698
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。