×

内在维度估计:进展和开放问题。 (英语) Zbl 1392.62171号

摘要:降维方法是用于处理高维数据的预处理技术。它们的目的是在不丢失信息的情况下,将原始的维数(N)数据集投影到一个低(M)维子流形上。由于(M)的值是未知的,因此允许预先知道(M)值的技术(称为内在维(ID))非常有用。本文的目的是回顾ID估计方法的最新进展,强调最新进展和存在的问题。

MSC公司:

62H25个 因子分析和主成分;对应分析
10层62层 点估计
62H20个 关联度量(相关性、典型相关性等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Beardwood,J。;霍尔顿,J.H。;Hammersley,《通过多个点的最短路径》,Proc。外倾角。菲罗。《社会学杂志》,55,299-327(1959)·Zbl 0118.35601号
[2] 贝尔金,M。;Niyogi,P.,用于降维和数据表示的拉普拉斯特征映射,神经计算。,15, 6, 1373-1396 (2003) ·Zbl 1085.68119号
[3] Bellman,R.,《自适应控制过程:导览》(1961),普林斯顿大学出版社·Zbl 0103.12901号
[4] Bennett,R.S.,《信号收集的内在维度》,IEEE Trans。《信息论》,1517-525(1969)·Zbl 0176.49604号
[5] Bishop,C.,《模式识别的神经网络》(1995),剑桥大学出版社
[6] Bishop,C.M.,贝叶斯主成分分析,神经信息处理系统进展,382-388(1998),麻省理工学院出版社
[7] Bouveyron,C。;Celeux,G。;Girard,S.,各向同性概率主成分分析中的最大似然内禀维数估计,模式识别。莱特。,32, 1706-1713 (2011)
[8] Brand,M.,绘制流形,神经信息处理进展,961-968(2003),麻省理工学院出版社
[9] 布鲁斯克,J。;Sommer,G.,最优拓扑保持映射的内在维度估计,IEEE Trans。模式分析。机器。智力。,20,572-575(1998年)
[10] Burdea,G。;Coiffet,P.,《虚拟现实技术》(2003),约翰威利父子公司:纽约
[11] 卡马斯塔,F。;Vinciarelli,A.,《使用基于分形的方法估计数据的固有维数》,IEEE Trans。模式分析。机器。智力。,24, 10, 1404-1407 (2002)
[12] Camastra,F.,《数据维度估计方法:调查》,模式识别。,36, 12, 2945-2954 (2003) ·Zbl 1059.68100号
[13] 卡马斯塔,F。;Filippone,M.,时间序列预测非线性动力学方法的比较评估,神经计算。申请。,18, 8, 1021-1029 (2009)
[14] Ceruti,C。;Bassis,S。;Rozza,A。;伦巴第,G。;Casiraghi,E。;Campadelli,P.,Danco:一种利用角度和范数集中的内在维度估计器,模式识别。,47, 2569-2581 (2014) ·Zbl 1339.68219号
[15] 查韦斯,E。;纳瓦罗,G。;Baeza-Yates,R。;Marroquin,J.L.,在度量空间中搜索,ACM计算。调查。,33, 3, 273-321 (2001)
[16] 克劳森,J。;Villmann,T.,优胜者放松神经气体中的放大控制,神经计算,63,1,125-137(2005)
[17] 科尔曼,T.F。;Li,Y.,有界非线性最小化的内信赖域方法,SIAM J.Optim。,6, 418-445 (1996) ·Zbl 0855.65063号
[18] 科尔曼,T.H。;Leiserson,C.E。;Rivest,R.L.,《算法导论》(1990),麻省理工学院出版社·Zbl 1158.68538号
[19] Costa,J。;Hero,A.,流形学习中维数和熵估计的测地熵图,IEEE Trans。信号处理。,52, 8, 2210-2221 (2004) ·Zbl 1369.68278号
[20] 考克斯,T.F。;Cox,M.A.A.,《多维标度》(2010),CRC出版社·Zbl 0853.62047号
[21] Demartines,P。;Herault,J.,《曲线成分分析:聚类分析中非线性映射的自组织神经网络》,IEEE Trans。神经网络。,8, 1, 148-154 (1997)
[22] 杜达,R。;哈特,P。;斯托克,D.,《模式分类》(2001),约翰威利父子公司:纽约·兹伯利0968.68140
[23] 埃克曼,J.P。;Ruelle,D.,混沌和奇怪吸引子的遍历理论,现代物理学评论。,57, 617-659 (1985) ·Zbl 0989.37516号
[24] 埃克曼,J.P。;Ruelle,D.,动力学系统中估计维数和lyapunov指数的基本限制,《物理学》,D-56185-187(1992)·Zbl 0759.58030号
[25] 埃夫隆,B。;Tibshirani,R.J.,Bootstrap简介(1993),Chapman和Hall·Zbl 0835.62038号
[26] 艾因贝克,J。;Kalantana,Z.,高维数据集的内在维度估计:相关维度计算的新方法,J.Emerg.Technol。网络智能。,5, 2, 91-97 (2013)
[27] 范,M。;乔·H。;张斌,用切球法估计流形的本征维数,模式识别。,42, 780-787 (2009) ·Zbl 1162.68405号
[28] 范,M。;张,X。;陈,S。;Bao,H。;Maybank,S.,通过最小覆盖近似对图像流形进行维数估计,神经计算,105,19-29(2013)
[29] 法拉赫曼德,A.M。;塞佩斯瓦里,C。;Audibert,J.-Y.,显式适应维度估计,第24届机器学习国际会议论文集,265-272(2007)
[30] Fishman,G.S.,《蒙特卡罗:概念、算法和应用》(1996),施普林格-弗拉格出版社·Zbl 0859.65001号
[31] Freedman,D.,从流形样本进行流形的高效单纯形重建,IEEE Trans。模式分析。机器。智力。,24, 10, 1349-1357 (2002)
[32] Fukunaga,K。;Olsen,D.,《求数据固有维数的算法》,IEEE Trans。计算。,C-20、2、176-183(1971)·Zbl 0216.50201号
[33] Fukunaga,K.,《内在维度提取、分类、模式识别和降维》,《统计手册》,347-360(1982),北荷兰:北荷兰阿姆斯特丹·Zbl 0543.62050号
[34] Fukunaga,K.,《统计模式识别导论》(1990),Morgan Kaufman·Zbl 0711.62052号
[35] 格拉斯伯格,P。;Procaccia,I.,《测量奇怪吸引子的奇异性》,《物理学》,D9189-208(1983)·Zbl 0593.58024号
[36] 关,Y。;Dy,J.G.,稀疏概率主成分分析,J.Mach。学习。研究-程序。轨道,5185-192(2009)
[37] 医学博士古普塔。;Huang,T.S.,固有维数估计的正则最大似然,第二十六届人工智能不确定性会议论文集(UAI2010),220-227(2010)
[38] Hausdorff,F.,《尺寸与质量》,数学。安,79,157(1918)
[39] 他,J。;丁·L。;江,L。;李,Z。;胡琼,基于流形假设的内在维数估计,J.Vis。Commun公司。图像表示。,25, 740-747 (2014)
[40] 海因,M。;Audibert,J.-Y.,《(R^d)中子流形的内在维数估计》,ICML'05年第22期会议录机器学习国际会议,289-296(2005)
[41] Heyting,A。;弗洛伊登塔尔,H.,L.E.J Brouwer作品集(1975),北荷兰爱思唯尔
[42] Hoeffing,W.,《一类具有渐近正态分布的统计》,《统计年鉴》,第19卷,第293-325页(1948年)·Zbl 0032.04101号
[43] Hoeffding,W.,有界随机变量和的概率不等式,美国统计协会杂志,58,13-30(1963)·兹伯利0127.10602
[44] Isham,V.,《混沌的统计方面:综述》,《网络与混沌统计与概率方面》,124-200(1993),Chapman&Hall·Zbl 0819.62083号
[45] Jain,A。;Dubes,R.,《聚类数据的算法》(1988),普伦蒂斯·霍尔:普伦蒂斯霍尔-恩格尔伍德悬崖·Zbl 0665.62061号
[46] Johnsson,K。;Soneson,C。;Fontes,M.,基于预期单纯形偏度的低偏差局部内禀维数估计,IEEE模式分析和机器智能汇刊,37,1,196-202(2015)
[47] Jollife,I.T.,主成分分析(1986),Springer-Verlag
[48] Jones,P.W.,《可纠正集与旅行推销员问题》,《数学发明》,第102期,第1-15页(1990年)·Zbl 0731.30018号
[49] 卡普兰,D。;Glass,L.,《理解非线性动力学》(1995),Springer-Verlag·Zbl 0823.34002号
[50] Karhunen,J。;Joutsensalo,J.,使用非线性pca类型学习的信号表示和分离,神经网络,7,1,113-127(1994)
[51] Kégl,B.,使用包装数的内禀维数估计,神经信息处理进展,681-688(2003),麻省理工学院出版社
[52] Kirby,M.,《几何数据分析:降维实证方法和模式研究》(2001),John Wiley and Sons·Zbl 1008.68116号
[53] Kohonen,T.,《自组织地图》(1995),斯普林格·弗拉格
[54] Kleindessner,M。;von Luxburg,U.,《无距离维度估计》,第18届国际情报与统计会议论文集,即将出版(2015)
[55] Kruskal,J.B.,关于图的最短生成子树和旅行推销员问题,《美国数学学会学报》,748-50(1956)·Zbl 0070.18404号
[56] Kruskal,J.B.,通过优化非计量假设的拟合优度实现多维标度,《心理测量学》,29,1-27(1964)·Zbl 0123.36803号
[57] Lee,J.M.,黎曼流形:曲率导论(1997),Springer-Verlag·Zbl 0905.53001号
[58] 莱维纳,E。;Bickel,P.,内在维度的最大似然估计,神经信息处理进展,777-784(2005),麻省理工学院出版社
[59] 李,J。;Tao,D.,简单指数族pca,《国际人工智能与统计会议论文集》(AISTATS),453-460(2010)
[60] Liao,L。;Zhang,Y。;马来亚银行,S.J。;Liu,Z.,基于最近约束子空间分类器的内禀维数估计,模式识别,47,3,1485-1493(2014)
[61] Lin,T。;Zha,H.,黎曼流形学习,《模式分析与机器智能汇刊》,30,5,796-809(2008)
[62] Little,A。;Jung,Y.-M。;Maggioni,M.,数据集内在维度的多尺度估计,流形学习及其应用:AAAI秋季研讨会论文,26-33(2009),IEEE
[63] 伦巴第,G。;Rozza,A。;Ceruti,C。;Casiraghi,E。;Campadelli,P.,内在维度的最小邻域距离估计,数据库中的机器学习和知识发现,374-389(2011),Springer
[64] Lorenz,E.N.,《确定性非周期流》,《大气科学杂志》,第20期,第130-141页(1963年)·Zbl 1417.37129号
[65] Mac Kay,D.J.C.,《概率网络和似然预测——监督神经网络实用贝叶斯方法综述》,《网络:神经系统中的计算》,6,3,469-505(1995)·Zbl 0834.68098号
[67] Malthouse,E.C.,用通用神经网络进行非线性主成分分析的局限性,IEEE神经网络交易,9,1165-173(1998)
[68] Mandelbrot,B.,《分形:形式、机会和维度》(1977),弗里曼·Zbl 0376.28020号
[69] 马尔迪亚,V.M。;Jupp,P.,《方向统计与概率》(2009),John Wiley&Sons
[70] 马丁内茨,T。;Schulten,K.,拓扑表示网络,神经网络,3507-522(1994)
[71] Mordohai,P。;Medioni,G.,《维数估计、流形学习和使用张量投票的函数近似》,《机器学习研究杂志》,11,410-450(2010)·Zbl 1242.68239号
[72] 尼科利奇,D。;莫卡,V。;辛格,W。;Muresan,R.,《用分形维数研究多元数据的特性》,《神经科学方法杂志》,172,27-33(2008)
[73] 奥加诺夫,A。;Valle,M.,《如何量化固体的能量分布》,《化学物理杂志》,130104504(2009)
[74] Ott,E.,动力系统中的混沌(1988),剑桥大学出版社:剑桥大学出版社·Zbl 0635.00009
[75] Pestov,V.,《数据集内在维度的公理方法》,神经网络,21,204-213(2008)·Zbl 1254.68102号
[76] 佩蒂斯,K。;Bailey,T。;Jain,T。;Dubes,R.,《近邻信息的内在维数估计》,IEEE模式分析和机器智能事务,1,1,25-37(1979)·Zbl 0418.68074号
[77] Prim,R.C.,《最短连接网络和一些推广》,贝尔系统技术期刊,361389-1401(1957)
[78] Raginsky,M。;Lazebnik,S.,使用高速矢量量化估计固有维数,神经信息处理进展,1105-1112(2006),麻省理工学院出版社
[79] A.K.罗姆尼。;Shepard,R.N。;Nerlove,S.B.,《多维尺度分析》,第一卷,理论(1972),研讨会出版社·Zbl 0251.92015号
[80] Roweis,S。;Saul,L.K.,通过局部线性嵌入降低非线性维数,《科学》,290,12,2323-2326(2000)
[81] Rozza,A。;伦巴第,G。;罗莎,M。;Casiraghi,E。;Campadelli,P.,Idea:内在维度估计算法,图像分析与处理-ICIAP 2011,433-442(2011),Springer
[82] Rozza,A。;伦巴第,G。;塞鲁蒂,C。;Casiraghi,E。;Campadelli,P.,《新型高内在维度估计量》,机器学习,89,1-2,37-65(2012)·Zbl 1260.68358号
[83] Sammon,J.W.J.,数据结构分析的非线性映射,IEEE计算机事务,C-18,401-409(1969)
[84] O.桑科。;马歇尔,A.D。;Rosin,P.,为isomap算法选择最佳参数值,模式识别字母,27,9,968-979(2006)
[85] Smith,R.,分形维数的最佳估计,非线性建模与预测,115-135(1992),Addison-Wesley:Addison-Wesley New York
[86] Snyder,D.,《随机点过程》(1975),威利出版社:威利纽约·Zbl 0385.60052号
[87] Takens,F.,《关于吸引子维数的数值确定》,《动力学系统与分岔》,《格罗宁根学报》1984,99-106(1985),Addison Wesley:Addison Wesley,纽约·兹比尔0561.58027
[88] Tanenbaum,J.B。;德席尔瓦,V。;Langford,J.C.,《非线性降维的全球几何框架》,《科学》,290,12,2319-2323(2000)
[89] Theiler,J.,分形维数最佳估计中的缺项,《物理快报》,A133195-200(1988)
[90] Theiler,J.,《尺寸估计器的统计精度》,《物理评论》,A413038-3051(1990)
[91] 泰勒,J。;欧洲银行。;Longtin,A。;Galdrikian,B。;Farmer,J.D.,《时间序列非线性测试:替代日期的方法》,《物理学》,D58,77-94(1992)·Zbl 1194.37144号
[92] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会期刊》,B辑,58267-288(1996)·Zbl 0850.62538号
[93] Tipping,M.E。;Bishop,C.M.,概率主成分分析,《皇家统计学会杂志》,B辑,61,第3部分,611-622(1997)·Zbl 0924.62068号
[94] Trunk,G.V.,噪声信号采集固有维数的统计估计,IEEE计算机事务,25,165-171(1976)·Zbl 0317.62068号
[95] 瓦莱,M。;Oganov,A.,《晶体指纹空间——研究晶体结构集的新范式》,《晶体学报》A卷,A66507-517(2010)
[96] Vapnik,V.,《统计学习理论》(1998),John Wiley and Sons·Zbl 0935.62007号
[97] Verveer,P.J。;Duin,R.,固有维数估计的评估,IEEE模式分析和机器智能事务,17,1,81-86(1995)
[98] 维尔曼,T。;Claussen,J.C.,自组织映射和神经气体中的放大控制,神经计算,18,2,446-469(2000)·兹比尔1110.68134
[99] Vo,A.P.V.编号。;Oraintara,S。;Nguyen,T.T.,在复方向小波域中使用von mises分布进行统计图像建模,ISCAS 2008,2885-2888(2008)
[100] 王,X。;Marron,J.,用切割球估计流形的本征维数,《电子统计杂志》,2127-148(2008)·Zbl 1320.62115号
[101] 杨,X。;Michea,S。;Zha,H.,圆锥维数作为内禀维数估计量及其应用,SIAM国际数据挖掘会议论文集,169-179(2007)
[102] Young,L.-S.,维数、熵和lyapunov指数,遍历理论和动力学系统,2,1,109-124(1918)·Zbl 0523.58024号
[103] 邹,H。;哈斯蒂,T。;Tibshirani,R.,《稀疏主成分分析》,《计算与图形统计杂志》,第15期,第262-286页(2004年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。