×

多维对数曲线密度的最大似然估计。通过讨论和作者的回复。 (英语) Zbl 1411.62055号

小结:设(X_1,\ldots,X_n)是具有(勒贝格)密度的独立同分布随机向量。我们首先证明,在概率为1的情况下,存在唯一的log-convave极大似然估计量{f} _n(n)\)第页,共页。该估计器的使用很有吸引力,因为与核密度估计不同,该方法是全自动的,没有平滑参数可供选择。虽然存在性证明是非结构性的,但我们可以重新定义计算问题{f} _n(n)\)根据一个不可微凸优化问题,从而将计算几何技术与Shor’s(r)-算法相结合,生成一个收敛到{f} n个\). 该算法的R版本可在任意维的LogConcDEAD–log-convave密度估计软件包中使用。我们证明了当真密度为对数压缩时,以及当该模型被错误指定时,该估计都具有吸引人的理论性质。对于我们模拟中的中等或较大样本量{f} _n(n)\)与基于核的方法相比,表明具有更小的平均积分平方误差,即使我们允许对核估计器使用在实践中不可用的理论上的最佳固定带宽。我们还提供了一个实际的数据聚类示例,这表明我们的方法可以与期望最大化算法结合使用,以拟合对数曲线密度的有限混合。

MSC公司:

62英尺10英寸 点估计
62G07年 密度估算
90C25型 凸面编程
62-02 与统计有关的研究展览(专著、调查文章)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abramson,I.(1982)关于核估计中的可变带宽——平方根定律。安。统计师。, 10, 1217– 1223. ·Zbl 0507.62040号
[2] An,M.Y.(1998)对数凹性与对数凸性:一个完整的特征。《经济学杂志》。理论。, 80, 350– 369. ·Zbl 0911.90071号
[3] Asuncion,A.和Newman,D.J.(2007)《UCI机器学习知识库》。加州大学欧文分校。(可从网址:http://www.ics.uci.edu/mlearn/MLRepository.html)
[4] Bagnoli,M.和Bergstrom,T.(2005)对数凹概率及其应用。经济。理论。, 26, 445– 469. ·Zbl 1077.60012号
[5] Balabdaoui,F.、Rufibach,K.和Wellner,J.A.(2009)对数凹密度最大似然估计的极限分布理论。安。统计师。,371299–1331·Zbl 1160.62008年
[6] Barber,C.B.、Dobkin,D.P.和Huhdanpaa,H.(1996)凸壳的Quickhull算法。ACM事务处理。数学。软件。, 22, 469– 483. ·Zbl 0884.65145号
[7] Barndorff‐Nielsen,O.(1978)《统计理论中的信息和指数族》。纽约:威利·Zbl 0387.62011号
[8] Boyd,S.和Vandenberghe,L.(2004)凸优化。剑桥:剑桥大学出版社·Zbl 1058.90049号
[9] Bozdogan,H.(1994)在标准混合模型聚类分析中选择聚类数、变量子集选择和离群值检测。《分类和数据分析的新方法》(编辑:E.Diday、Y.Lechevallier、M.Schader、P.Bertrand和B.Burtschy),第169-177页。纽约:斯普林格。
[10] Breiman,L.、Meisel,W.和Purcell,E.(1977)多元密度的可变核估计。技术计量学, 19, 135– 144. ·Zbl 0379.62023号
[11] Brooks,S.P.(1998)通过对数凹密度的多元界进行MCMC收敛诊断。安。统计师。, 26, 398– 433. ·Zbl 0961.65002号
[12] Caplin,A.和Nalebuff,B.(1991a)《聚合与社会选择:平均选民定理》。计量经济学,59,1-23·Zbl 0743.90006号
[13] Caplin,A.和Nalebuff,B.(1991b)《聚合与不完全竞争:均衡的存在性》。计量经济学, 59, 25– 59. ·Zbl 0738.90012号
[14] Chacón,J.E.(2009)核密度估计器平滑参数化的数据驱动选择。可以。J.统计。, 34, 249– 265. ·Zbl 1176.62028号
[15] Chacón,J.E.,Duong,T.和Wand,M.P.(2010)一般多元核密度导数估计量的渐近性。统计师。罪。,待发布。
[16] Chang,G.和Walther,G.(2007)混合对数凹分布的聚类。计算统计。数据分析。, 51, 6242– 6251. ·Zbl 1445.62141号
[17] 邱,S.‐T。(1992)用于核密度估计的自动带宽选择器。生物特征, 79, 771– 782. ·Zbl 0764.62034号
[18] Cule,M.L.(2009)多元对数凹密度的最大似然估计。博士论文。剑桥大学,剑桥。
[19] Cule,M.L.和Dümbgen,L.(2008)关于对数密度估计的辅助函数。技术报告71。伯尔尼大学。
[20] Cule,M.L.、Gramacy,R.B.和Samworth,R.J.(2007)《对数凹面密度的最大似然估计》。剑桥统计实验室。(可从http://CRAN.R网站‐project.org/package=LogConcDEAD.)
[21] Cule,M.L.、Gramacy,R.B.和Samworth,R.J.(2009)LogConcDEAD:多元对数凹密度最大似然估计的R包。J.统计。软件。,29,第2版。
[22] Cule,M.L.和Samworth,R.J.(2010),多维密度对数凹极大似然估计的理论性质。电子。J.统计。, 4, 254– 270. ·Zbl 1329.62183号
[23] Cule,M.L.、Samworth,R.J.和Stewart,M.I.(2010)多维对数凹面密度的最大似然估计(长版)。剑桥统计实验室。(可从http://www.statslab.cam.ac.uk/rjs57/Research.html)·Zbl 1329.62183号
[24] Ćwik,J.和Koronacki,J.(1997)多变量密度估计:一项比较研究。诺尔。计算应用程序。, 6, 173– 185.
[25] Deheuvels,P.(1977)《广义统计图非参数估计II》。出版物。仪器统计。巴黎大学, 22, 1– 23. ·Zbl 0375.62038号
[26] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977)通过EM算法从不完整数据中获得最大似然(带讨论)。J.R.统计。Soc.B公司, 39, 1– 38. ·Zbl 0364.62022号
[27] Devroye,L.、Györfi,L.和Lugosi,G.(1996)《模式识别的概率理论》。纽约:斯普林格·Zbl 0853.68150号
[28] Donoho,D.L.,Johnstone,I.M.,Kerkyacharian,G.和Picard,D.(1996)小波阈值密度估计。安。统计师。, 24, 508– 539. ·Zbl 0860.62032号
[29] Dümbgen,L.、Hüsler,A.和Rufibach,K.(2007)基于完整和删失数据的对数凹密度的主动集和EM算法。技术报告61。伯尔尼大学。(可从网址:http://arxiv.org/abs/0707.4643/。)
[30] Dümbgen,L.和Rufibach,K.(2009)对数凹密度及其分布函数的最大似然估计:基本特性和一致一致性。伯努利, 15, 40– 68. ·Zbl 1200.62030号
[31] Dümbgen,L.、Samworth,R.J.和Schuhmacher,D.(2010)对数凹分布的近似及其回归应用。技术报告75。伯尔尼大学。(可从http://arxiv.org/abs/1002.3448/。)
[32] Duong,T.(2004)多元核密度估计的带宽选择器。博士论文。西澳大利亚大学珀斯分校·Zbl 1060.62042号
[33] Duong,T.和Hazelton,M.L.(2003)用于二元核密度估计的插件带宽矩阵。J.Nonparam(非参数)。统计人员。, 15, 17– 30. ·Zbl 1019.62032号
[34] Duong,T.和Hazelton,M.L.(2005)多元核密度估计中无约束带宽矩阵选择器的收敛速度。J.Multiv.公司。分析。, 93, 417– 433. ·Zbl 1066.62059号
[35] Eggermont,P.P.B.和LaRiccia,V.(2001)最大惩罚似然估计,第1卷,密度估计。纽约:斯普林格·Zbl 0984.62026号
[36] Eubank,R.L.(1988)样条平滑和非参数回归。纽约:Dekker·Zbl 0702.62036号
[37] Fix,E.和Hodges,J.L.(1951)判别分析非参数判别:一致性性质。技术报告4,项目21-29-004。美国空军航空医学院(Randolph Field)·Zbl 0715.62080号
[38] Fix,E.和Hodges,J.L.(1989)判别分析-非参数判别:一致性属性。国际统计。版次。, 57, 238– 247. ·Zbl 0715.62080号
[39] Fraley,C.F.和Raftery,A.E.(2002)基于模型的聚类、判别分析和密度估计。《美国统计杂志》。助理。, 97, 611– 631. ·Zbl 1073.62545号
[40] Gordon,A.D.(1981)分类。伦敦:查普曼和霍尔·Zbl 0507.62057号
[41] Grenander,U.(1956)《死亡率测量理论2》。斯坎德。阿克特。, 39, 125– 153. ·Zbl 0077.33715号
[42] Groeneboom,P.,Jongbloed,G.和Wellner,J.A.(2001)凸函数的估计:特征和渐近理论。安。统计师。, 29, 1653– 1698. ·Zbl 1043.62027号
[43] Groeneboom,P.、Jongbloed,G.和Wellner,J.A.(2008)混合模型中计算非参数函数估计的支持约简算法。扫描。J.统计。, 35, 385– 399. ·Zbl 1199.65017号
[44] Groeneboom,P.和Wellner,J.A.(1992)《信息界和非参数最大似然估计》。巴塞尔:Birkhä用户·Zbl 0757.62017号
[45] Hall,P.、Marron,J.S.和Park,B.U.(1992)平滑交叉验证。普罗巴伯。西奥。Reltd Flds公司, 92, 1– 20. ·Zbl 0742.62042号
[46] Hall,P.、Park,B.U.和Samworth,R.J.(2008)《最近邻分类中邻序的选择》。安。统计师。, 36, 2135– 2152. ·Zbl 1274.62421号
[47] Hand,D.J.(1981)《歧视与分类》。纽约:威利·Zbl 0587.62119号
[48] Hyndman,R.J.(1996)计算和绘制最高密度区域。美国统计局, 50, 120– 126.
[49] Ibragimov,A.I.(1956)关于单峰分布的构成。西奥。普罗巴伯。申请。, 1, 255– 260.
[50] Jongbloed,G.(1998)非参数估计的迭代凸次优算法。J.计算图表。统计人员。, 7, 310– 321.
[51] Kappel,F.和Kuntsevich,A.(2000)Shor的实施第页算法。计算优化应用。, 15, 193– 205. ·Zbl 0947.90112号
[52] Koenker,R.和Mizera,I.(2010)准凹密度估计。安。统计师。,即将发布·Zbl 1200.62031号
[53] Lee,C.W.(2004)多面体的细分和三角剖分。《离散和计算几何手册》(编辑J.E.Goodman和J.O’Rourke),第2版,第383-406页。纽约:CRC出版社。
[54] McLachlan,G.J.和Basford,K.E.(1988)《混合模型:聚类的推断和应用》,纽约:Dekker·Zbl 0697.62050号
[55] McLachlan,G.J.和Krishnan,T.(1997)EM算法和扩展。纽约:威利·Zbl 0882.62012号
[56] Mengersen,K.L.和Tweedie,R.L.(1996)黑斯廷斯和大都会算法的收敛速度。安。统计师。, 24, 101– 121. ·兹比尔0854.60065
[57] Pal,J.K.、Woodroof,M.和Meyer,M.(2007)《Polya频率函数的估算》。《复杂数据集和反问题:层析成像、网络及其以外》,第239-249页。俄亥俄州:数学统计研究所。
[58] Parzen,E.(1962)关于概率密度函数和模的估计。安。数学。统计人员。, 33, 1065– 1076. ·Zbl 0116.11302号
[59] Prékopa,A.(1973)关于对数凹测度和函数。科学学报。数学。, 34, 335– 343. ·Zbl 0264.90038号
[60] R开发核心团队(2009)R:统计计算的语言和环境。维也纳:R统计计算基金会。
[61] Rockafellar,R.T.(1997)凸分析。普林斯顿:普林斯顿大学出版社·Zbl 0932.90001号
[62] Rosenblatt,M.(1956)关于密度函数的一些非参数估计的评论。安。数学。统计人员。, 27, 832– 837. ·Zbl 0073.14602号
[63] Rufibach,K.(2007)计算对数凹密度函数的最大似然估计。J.统计。计算机模拟, 77, 561– 574. ·Zbl 1146.62027号
[64] Rufibach,K.和Dümbgen,L.(2006)logcondens:根据i.i.D.观测值估计对数凹概率密度。伯尔尼大学。(可从http://CRAN.R网站‐project.org/package=logcondens。)
[65] Sain,S.R.(2002)多元局部自适应密度估计。计算统计。数据分析。, 39, 165– 186. ·兹比尔1132.62329
[66] Sain,S.R.和Scott,D.W.(1996)关于局部自适应密度估计。《美国统计杂志》。助理。, 91, 1525– 1534. ·Zbl 0882.62035号
[67] Schuhmacher,D.和Dümbgen,L.(2010)多元对数凹密度估计的一致性。统计师。普罗巴伯。莱特。, 80, 376– 380. ·Zbl 1181.62048号
[68] Schuhmacher,D.、Hüsler,A.和Dümbgen,L.(2009)多元对数凹分布作为一个近似参数模型。技术报告74。伯尔尼大学。(可从http://arxiv.org/pdf/0907.0250v2。)
[69] Scott,D.W.和Sain,S.R.(2004)多维密度估算。《统计手册》(C.R.Rao和E.J.Wegman编辑),第23卷,数据挖掘和计算统计阿姆斯特丹:爱思唯尔。
[70] Seregin,A.和Wellner,J.A.(2010)凸变换密度的非参数估计Ann。统计人员。,待发布·兹比尔1204.62058
[71] Shor,N.Z.(1985)不可微函数的最小化方法。柏林:斯普林格·Zbl 0561.90058号
[72] Street,W.M.、Wolberg,W.H.和Mangasarian,O.L.(1993)乳腺肿瘤诊断的核特征提取。程序中。国际交响乐团。《电子成像:科学与技术》,圣何塞,第861-870页。
[73] Swales,J.D.(编辑)(1985年)《普拉特诉皮克林:近代医学史上的一集》。剑桥:凯恩斯。
[74] Titterington,D.M.、Smith,A.F.M.和Makov,U.E.(1985)《有限混合分布的统计分析》。奇切斯特:威利·Zbl 0646.62013.中
[75] Vapnik,V.N.和Mukherjee,S.(2000)多变量密度估计的支持向量方法。《神经信息处理系统进展》,第659-665页。剑桥:麻省理工学院出版社。
[76] Wahba,G.(1990)观测数据的样条模型。费城:工业和应用数学学会·Zbl 0813.62001号
[77] Walther,G.(2002)用多尺度最大似然检测混合的存在。《美国统计杂志》。助理。, 97, 508– 513. ·Zbl 1073.62533号
[78] Walther,G.(2009)对数凹分布的推断和建模。统计师。科学。, 24, 319– 327. ·Zbl 1329.62192号
[79] Wand,M.P.和Jones,M.C.(1995)《内核平滑》。博卡拉顿:查普曼和霍尔——CRC出版社·Zbl 0854.62043号
[80] Zhang,X.,King,M.L.和Hyndman,R.J.(2006)使用MCMC进行多元核密度估计的带宽选择。计算统计。数据分析。, 50, 3009– 3031. ·Zbl 1445.62077号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。