张正武;埃里克·克拉森;阿努伊·斯利瓦斯塔瓦 球形域上核密度的稳健比较。 (英语) Zbl 1422.62145号 Sankhyá,Ser。A类 81,第1号,144-171(2019). 摘要:虽然球形数据在许多情况下都会出现,包括在方向统计中,但目前用于球形密度估计和人口比较的工具非常有限。比较总体的流行方法(在欧几里德域上)主要涉及两步程序:(1)估计概率密度函数(pdf格式s) 从他们各自的样本中,最常用的是使用核密度估计,以及(2)比较pdf格式s使用诸如\(mathbb{L}^{2}\)范数之类的度量。然而,估计pdf格式s及其差异在很大程度上取决于所选的内核、带宽和样本大小。在这里,我们开发了一个比较球形种群的框架,该框架对这些选择是稳健的。本质上,我们描述pdf格式通过量化球面域上的光滑度。我们的框架使用光谱表示,密度由它们相对于球体上拉普拉斯算子的本征函数的系数表示。平滑度的变化类似于使用不同的核带宽,由系数值的指数衰减控制。然后我们推导出一个适当的距离来进行比较pdf格式系数,同时均衡平滑度,消除了样本大小和带宽的影响。这意味着对人群进行公平而有意义的比较,尽管样本大小相差悬殊,并导致稳健和改进的性能。我们使用(mathbb{S}^{1})和(mathbb{S}^{2})上的变量示例演示了该框架,并使用大量模拟和实际数据实验评估了其性能。 引用于三文件 MSC公司: 62G07年 密度估算 62G35型 非参数稳健性 35K05美元 热量方程式 关键词:核估计;双样本假设检验;稳健密度比较 软件:SIFT公司 PDF格式BibTeX公司 XML格式引用 \textit{Z.Zhang}等人,Sankhyá,Ser。A 81,No.1,144--171(2019;Zbl 1422.62145) 全文: 内政部 arXiv公司 参考文献: [1] Anderson,N.、Hall,P.和Titterington,D.(1994年)。使用基于核的密度估计测量两个多元概率密度函数之间差异的双样本检验统计。多元分析杂志50,1,41-54·Zbl 0798.62055号 ·doi:10.1006/jmva.1994.1033 [2] Boothby,W.M.(2003)。可微流形和黎曼几何导论,第2版。纽约学术出版社·Zbl 0596.53001号 [3] Botev,Z.I.、Grotowski,J.F.和Kroese,D.P.(2010年)。通过扩散估计核密度。统计年鉴38,5,2916-2957·Zbl 1200.62029号 ·doi:10.1214/10-AOS799 [4] 鲍曼·A.W.(1984)。密度估计值平滑的另一种交叉验证方法。生物特征71,2353-360·doi:10.1093/biomet/71.2.353 [5] Cha,S.-H.(2007)。概率密度函数之间距离/相似性度量的综合调查。国际应用科学数学模型和方法杂志1,4,300-307。 [6] Chaudhry,R.、Ravich,A.、Hager,G.和Vidal,R.(2009年)。非线性动力学系统上用于识别人类行为的定向光流直方图和Binet-Cauchy核。收录于:IEEE计算机视觉和模式识别会议,第1932-1939页。 [7] Chaudhuri,P.和Marron,J.S.(2000年)。曲线估计的缩放空间视图。《统计年鉴》28,2,408-428·兹比尔1106.62318 ·doi:10.1214/aos/1016218224 [8] Dallal,N.和Triggs,B.(2005年)。人体检测定向梯度直方图。摘自:计算机视觉和模式识别国际会议,第2卷,第886-893页。 [9] Gretton,A.、Borgwardt,K.M.、Rasch,M.J.、Schölkopf,B.和Smola,A.(2012)。内核两样本测试。机器学习研究杂志13,723-773·Zbl 1283.62095号 [10] Gretton,A.、Borgwardt,K.、Rasch,M.、Schölkopf,B.和Smola,A.(2007年)。两样本问题的核方法。摘自:《神经信息处理系统进展》19,麻省理工学院出版社,第513-520页。 [11] Hartman,P.和Watson,G.S.(1974年)。球面上的正态分布函数和修正的贝塞尔函数。概率年鉴2,4,593-607·Zbl 0305.60033号 ·doi:10.1214/aop/1176996606 [12] Jones,C.、Marron,J.S.和Sheather,S.J.(1996a)。基于数据的核密度估计带宽选择研究进展。计算统计11,337-381·Zbl 0897.62037号 [13] Jones,M.C.、Marron,J.S.和Sheather,S.J.(1996b)。密度估计中带宽选择的简要概述。《美国统计协会杂志》91,401-407·Zbl 0873.62040号 ·doi:10.1080/01621459.1996.10476701 [14] Klassen,E.和Srivastava,A.(2006年)。使用路径校正的三维闭合曲线之间的测地线。摘自:《ECCV会议录》,计算机科学讲稿,第一页:95-106。 [15] Klemelä,J.(2000)。用定向数据估计密度和密度导数。多元分析杂志73,1,18-40·兹比尔1054.62033 ·doi:10.1006/jmva.1999.1861 [16] Lafferty,J.和Lebanon,G.(2005年)。统计流形上的扩散核。机器学习研究杂志6,129-163·Zbl 1222.68240号 [17] 朗诗,C.,富兰克林,J.和贝文,J.(2015)。修订后的大西洋飓风数据库(HURDAT2),NOAA/NHC。[网址:nhc.noaa.gov]。 [18] Lindeberg,T.(1990年)。离散信号的缩放空间。IEEE模式分析和机器智能汇刊12,234-254·doi:10.1109/34.49051 [19] Liu,G.,Chang,S.和Ma,Y.(2014)。使用卷积算子的频谱特性的盲图像去模糊。IEEE图像处理汇刊23,12,5047-5056·Zbl 1374.94222号 ·doi:10.10109/TIP.2014.2362055 [20] Liu,X.和Wang,D.(2003)。使用光谱直方图进行纹理分类。IEEE图像处理汇刊12,661-670·doi:10.1109/TIP.2003.812327 [21] Lowe,D.G.(2004)。具有与比例不变关键点不同的图像特征。国际计算机视觉杂志60,91-110·doi:10.1023/B:VISI.0000029664.99615.94 [22] Marron,J.S.和Nolan,D.(1988年)。密度估计的标准核。统计与概率快报7、3、195-199·Zbl 0662.62035号 ·doi:10.1016/0167-7152(88)90050-8 [23] Marron,J.和Schmitz,H.-P.(1992年)。几种收入分配的同时密度估计。计量经济学理论8,476-488·网址:10.1017/S0266466600013177 [24] Osada,R.、Funkhouser,T.、Chazelle,B.和Dobkin,D.(2002年)。形状分布。ACM图形交易21,4,807-832·Zbl 1331.68256号 ·数字对象标识代码:10.1145/571647.571648 [25] Parzen,E.(1962年)。关于概率密度函数和模式的估计。《数理统计年鉴》33,3,1065-1076·Zbl 0116.11302号 ·doi:10.1214/aoms/1177704472 [26] Rosenblatt,M.(1956年)。关于密度函数的一些非参数估计的注记。《数理统计年鉴》27,3832-837·Zbl 0073.14602号 ·doi:10.1214/aoms/1177728190 [27] Scott,D.W.和Terrell,G.R.(1987年)。密度估计中的有偏和无偏交叉验证。《美国统计协会杂志》82,400,1131-1146·Zbl 0648.62037号 ·doi:10.1080/01621459.1987.10478550 [28] Smirnov,N.(1948年)。经验分布拟合优度估算表。《数理统计年鉴》19,2279-281·Zbl 0031.37001号 ·doi:10.1214/aoms/1177730256 [29] Turlach,B.A.(1993年)。核密度估计中的带宽选择:综述。摘自:CORE和统计研究所,第23-493页。 [30] Viola,P.和Jones,M.(2001年)。使用简单特征的增强级联进行快速物体检测。摘自:计算机视觉和模式识别国际会议,第511-518页。 [31] Zhang,Klassen,E.和Srivastava,A.(2013)。信号和图像的高斯模糊变分比较。IEEE图像处理学报22,8,3145-3157·doi:10.1109/TIP.2013.2259840 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。