×

快速多元对数凹密度估计。 (英语) Zbl 1496.62021号

摘要:提出了一种新的对数凹密度估计的计算方法。以前的方法利用给定样本集诱导的密度的分段仿射参数化。确定最大似然密度估计的参数数量以及基于非光滑次梯度的凸优化导致维数(d\geq 2)和大样本集的运行时间过长。该方法基于目标函数的适度非凸光滑近似稀疏的,自适应分段仿射密度参数化。已建立的节省内存的数值优化技术能够处理维度(d\geq 2)的较大数据集。虽然不能保证算法会返回每个问题实例的最大似然估计,但我们提供了全面的数字证据,证明在显著缩短运行时间后,它确实会产生接近最优的结果。例如,在\(\mathbb{R}^2)中的10000个样本在两秒内处理,而不是在上一种终止方法所需的\(大约14小时)内处理。对于更高的维度,密度估计也变得容易处理:在(mathbb{R}^6)中处理10000个样本需要35分钟。该软件作为CRAN R包公开提供。

MSC公司:

62-08 统计问题的计算方法
62-04 统计相关问题的软件、源代码等
62G07年 密度估算
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Acharya,J.,Diakonikolas,I.,Li,J..,Schmidt,L.,2017年。近线性时间内的样本最优密度估计。摘自:第二十八届ACM-SIAM离散算法研讨会论文集。第1278-1289页。;Acharya,J.,Diakonikolas,I.,Li,J..,Schmidt,L.,2017年。近线性时间内的样本最优密度估计。摘自:第二十八届ACM-SIAM离散算法研讨会论文集。第1278-1289页·Zbl 1411.68091号
[2] Axelrod,B.,Valiant,G.,2018年。一种高效的高维对数压缩最大似然算法。arXiv预打印arXiv:1811.03204;Axelrod,B.,Valiant,G.,2018年。一种高效的高维对数凹极大似然算法。arXiv预打印arXiv:1811.03204
[3] 巴伯,C。;Dobkin,D.P。;Huhdanpaa,H.,凸壳的快速壳算法,ACM Trans。数学。软件,22,4,469-483(1996)·Zbl 0884.65145号
[4] 巴蒂亚,R.,正定矩阵(2006),普林斯顿大学出版社
[5] H.J.本加兹。;Griebel,M.,《稀疏网格》,《数值学报》。,13, 147-269 (2004) ·Zbl 1118.65388号
[6] 陈,Y。;Samworth,R.J.,平滑对数凹极大似然估计及其应用,统计学。Sinica,23(2013)·Zbl 06202711号
[7] 库勒,M。;萨姆沃思,R。;Stewart,M.,多维对数曲线密度的最大似然估计,J.R.Stat.Soc.Ser。B统计方法。,72, 5, 545-607 (2010) ·Zbl 1411.62055号
[9] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B统计方法。,39, 1, 1-38 (1977) ·Zbl 0364.62022号
[10] 迪亚科尼科拉斯,I。;凯恩,D.M。;Stewart,A.,《学习多元对数压缩分布》,(Kale,S.;Shamir,O.,《2017年学习理论会议论文集》,PMLR
[11] Diakonikolas,I.,Sidiropoulos,A.,Stewart,A.,2018年。多元对数凹密度最大似然估计的多项式时间算法。arXiv预打印arXiv:1812.05524;Diakonikolas,I.,Sidiropoulos,A.,Stewart,A.,2018年。多元对数凹密度最大似然估计的多项式时间算法。arXiv预打印arXiv:1812.05524
[13] Dümbgen,L。;Rufibach,K.,对数曲线密度及其分布函数的最大似然估计:基本性质和一致一致性,Bernoulli,15,1,40-68(2009)·Zbl 1200.62030号
[14] Dwyer,R.A.,线性期望时间下的高维voronoi图,离散计算。地理。,6, 343-367 (1991) ·Zbl 0727.68128号
[15] 弗雷利,C。;Raftery,A.E。;墨菲,T.B。;Scrucca,L.,mclust第4版R:基于模型的聚类、分类和密度估计的正态混合建模(2012),华盛顿大学统计系
[16] Grundmann,A。;Möller,H.-M.,用组合方法求解n单纯形的不变量积分公式,SIAM J.Numer。分析。,15, 2, 282-290 (1978) ·Zbl 0376.65013号
[18] Lovász,L。;Deák,I.,体积算法的计算结果,欧洲期刊Oper。第216、152-161号决议(2012年)·Zbl 1242.90165号
[19] Lovász,L。;Vempala,S.,《对数压缩函数的快速算法:采样、舍入、积分和优化》,(计算机科学基础(FOCS)(2006),IEEE),57-68
[20] Lovász,L。;Vempala,S.,对数凹函数的几何和采样算法,随机结构算法,30,307-358(2007)·Zbl 1122.65012号
[22] Nocedal,J。;Wright,S.,《数值优化》(2006),Springer Science&Business Media·兹比尔1104.65059
[23] Rathke,F。;Schnörr,C.,fmlogconcentre:快速多变量对数凹形密度估计(2018),R包版本1.0.2。https://cran.r-project.org/package=fmlogcondens
[24] Rockafellar,R.T。;Wets,R.J.-B.,变分分析,第317卷(2009年),施普林格出版社
[26] Samworth,R.J.,2017年。对数曲线密度估计的最新进展。arXiv预印arXiv:1709.03154;Samworth,R.J.,2017年。对数曲线密度估计的最新进展。arXiv预打印arXiv:1709.03154·Zbl 1407.62126号
[27] Silverman,B.,《关于用最大惩罚似然法估计概率密度函数》,Ann.Statist。,10, 3, 795-810 (1982) ·Zbl 0492.62034号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。