×

基于广义线性建模的局部内禀维数估计。 (英语) Zbl 1461.62247号

摘要:我们提出了一种内禀维数估计方法。通过将距离检测点的距离幂和半径等于该距离的球内包含的样本数量拟合到回归模型,我们估计了拟合优度。然后,利用最大似然法估计检测点周围的局部内禀维数。在全局内禀维数估计实验中,该方法与传统方法具有可比性。此外,我们的实验表明,该方法优于传统的局部维数估计方法。

MSC公司:

62R40型 拓扑数据分析
62G05型 非参数估计
62G07年 密度估算
54层45 一般拓扑学中的维数理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ali,S.M.和Silvey,S.D.(1966年)。一种分布与另一种分布的散度系数的一般类别。英国皇家统计学会杂志。B系列(方法学),28,131-142·Zbl 0203.19902号
[2] Amsaleg,L.、Chelly,O.、Furon,T.、Girard,S.、Houle,M.E.、Kawarabayashi,K.和Nett,M.(2015)。估计局部固有维数。第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集(第29-38页),纽约:ACM·Zbl 1428.60071号
[3] Biau,G.、Chazal,F.、Cohen-Steiner,D.、Devroye,L.和Rodriguez,C.(2011年)。几何推断的加权##img##-最近邻密度估计。《电子统计杂志》,5204-237·Zbl 1274.62264号
[4] Brand,M.(2002)。绘制流形。S.Becker、S.Thrun和K.Obermayer(编辑),《神经信息处理系统的进展》,15(第961-968页)。马萨诸塞州剑桥:麻省理工学院出版社。
[5] Bruske,J.和Sommer,G.(1998年)。具有最优拓扑保持映射的内在维数估计。IEEE模式分析和机器智能汇刊,20(5),572-575,
[6] Camastra,F.和Vinciarelli,A.(2002年)。用基于分形的方法估计数据的内在维数。IEEE模式分析和机器智能汇刊,24(10),1404-1407,
[7] Cook,R.D.和Yin,X.(2001)。判别分析中的降维和可视化(带讨论)。澳大利亚和新西兰统计杂志,43(2),147-199·兹比尔0992.62056
[8] Costa,J.A.和Hero,A.O.III(2004年)。流形学习中用于维数和熵估计的测地熵图。IEEE信号处理汇刊,52,2210-2221·Zbl 1369.68278号
[9] Csiszár,I.和Shields,P.C.(2004)。信息理论与统计学:教程。信息传播理论,1(4),417-528·Zbl 1156.62300号
[10] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。英国皇家统计学会杂志,B辑,39,1-38·Zbl 0364.62022号
[11] Dobson,A.J.(2002)。广义线性模型简介。佛罗里达州博卡拉顿:查普曼和霍尔/CRC·Zbl 1008.62067号
[12] Eriksson,B.和Crovella,M.(2012年)。通过聚类估计内在维度,摘自IEEE统计信号处理研讨会论文集(760-763页)。新泽西州皮斯卡塔韦:IEEE。
[13] Falconer,K.J.(1990年)。分形几何:数学基础和应用。纽约:Wiley·Zbl 0689.28003号
[14] Fan,M.、Qiao,H.和Zhang,B.(2009年)。通过切割球估计流形的内在维数。模式识别,42(5),780-787·Zbl 1162.68405号
[15] Farahmand,A.M.、Szepesvári,C.和Audibert,J-Y.(2007)。显式自适应维度估计。在Z.Gahramani(编辑)中。第二十四届国际机器学习会议记录(第265-272页)。科尔瓦利斯,俄勒冈州:Omnipress。
[16] Fukunaga,K.和Olsen,D.R.(1971)。一种求数据内在维数的算法。IEEE计算机事务,20(2),176-183·Zbl 0216.50201号
[17] Grassberger,P.和Procaccia,I.(1983年)。测量奇怪吸引子的奇异性。《物理学D:非线性现象》,9(1-2),189-208·Zbl 0593.58024号
[18] Gupta,M.D.和Huang,T.S.(2010)。内禀维数估计的正则最大似然法。在P.Grunwald和P.Spirtes(编辑),《第二十六届人工智能不确定性会议论文集》(第220-227页)。科尔瓦利斯,俄勒冈州:AUAI出版社。
[19] Hein,M.和Audibert,J-Y.(2005)。R##img##中子流形的内在维数估计。《第二十二届机器学习国际会议论文集》(第289-296页)。纽约:ACM。
[20] Hentschel,H.G.E.和Procaccia,I.(1983年)。分形和奇异吸引子的广义维数的无限个。《物理学D:非线性现象》,8(3),435-444·Zbl 0538.58026号
[21] Hoare,C.A.R.(1961年)。算法64:快速排序。Commun公司。美国医学会,4(7),321,
[22] Houle,M.E.(2013)。维数、可区分性、密度和距离分布。第13届IEEE国际数据挖掘研讨会会议记录(第468-473页)。费城:SIAM,
[23] Houle,M.E.,Kashima,H.,&Nett,M.(2012)广义扩张维。第13届IEEE国际数据挖掘研讨会会议记录(第587-594页)。费城:SIAM,
[24] Kambhatla,N.和Leen,T.K.(1997)。通过局部主成分分析进行降维。神经计算,9(7),1493-1516,
[25] Karger,D.R.和Ruhl,M.(2002年)。在增长受限的指标中查找最近的邻居。第三十四届ACM计算机理论年会论文集(第741-750页)。纽约:ACM·兹比尔1192.68750
[26] Kégl,B.(2002年)。使用包装号进行固有尺寸估计。S.Becker S.Thrun和K.Obermayer(编辑),《神经信息处理系统的进展》,15(第681-688页)。马萨诸塞州剑桥:麻省理工学院出版社。
[27] Kokiopoulou,E.和Saad,Y.(2007年)。正交邻域保持投影:一种基于投影的降维技术。IEEE模式分析和机器智能汇刊,29(12),2143-2156,
[28] Lee,J.A.和Verleysen,M.(2007年)。非线性降维。纽约:施普林格·Zbl 1128.68024号
[29] Levina,E.和Bickel,P.J.(2005年)。内禀维数的最大似然估计。L.K.Saul、Y.Weiss和L.Bottou(编辑),《神经信息处理系统的进展》,17(第777-784页)。马萨诸塞州剑桥:麻省理工学院出版社。
[30] Ma,Y.,&Fu,Y..(2011)。流形学习理论与应用。佛罗里达州博卡拉顿:CRC出版社。
[31] Meng,X-L.和Rubin,D.B.(1991)。使用EM获得渐近方差-方差矩阵:SEM算法。美国统计协会杂志,86(416),899-909,
[32] Moon,K.R.和Hero,A.O.(2014)。带置信度的多元f-散度估计。Z.Ghahramani、M.Welling、C.Cortes、N.D.Lawrence和K.Q.Weinberger(编辑),《神经信息处理系统的进展》,27(第2420-2428页)。纽约州红钩市:Curran。
[33] Oja,E.(1983年)。模式识别的子空间方法。英国赫特福德郡:研究出版社。
[34] Pesin,Y.B.(1993)。关于关联维数的严格数学定义和维数的广义谱。统计物理杂志,71(3),529-547·Zbl 0916.28006号
[35] Pesin,Y.B.(1997)。动力系统中的维度理论:当代观点和应用。芝加哥:芝加哥大学出版社·Zbl 0895.58033号
[36] Pettis,K.W.、Bailey,T.A.、Jain,A.K.和Dubes,R.C.(1979年)。基于近邻信息的内在维数估计。IEEE模式分析和机器智能汇刊,1(1),25-37·兹伯利0418.68074
[37] Rényi,A.(1959年)。关于概率分布的维数和熵。匈牙利科学院数学学报,10(1),193-215·Zbl 0088.10702号
[38] Rilstone,P.、Srivastava,V.K.和Ullah,A.(1996)。非线性估计量的二阶偏差和均方误差。计量经济学杂志,75(2),369-395·Zbl 0866.62010号
[39] Rozza,A.、Lombardi,G.、Ceruti,C.、Casiraghi,E.和Campadelli,P.(2012年)。新型高固有维数估计器。机器学习,89(1),37-65·Zbl 1260.68358号
[40] Sricharan,K.和Hero,A.O.(2012年)。多元熵估计的集合加权核估计。F.Pereira、C.J.C.Burges、L.Bottou和K.Q.Weinberger(编辑)。神经信息处理系统进展,25(第566-574页)。纽约州红钩市:Curran。
[41] Tenenbaum,J.B.、Silva,V.和Langford,J.C.(2000)。非线性降维的全局几何框架。科学,290(5500),2319-2323,
[42] Tsybakov,A.B.(2009年)。非参数估计简介。纽约:斯普林格·Zbl 1176.62032号
[43] Verveer,P.J.和Duin,R.P.W.(1995)。内在维度估计的评估。IEEE模式分析和机器智能汇刊,17(1),81-86,
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。