×

使用连续嵌入可视化距离变化对数据的影响。 (英语) Zbl 1466.62083号

摘要:大多数机器学习(ML)方法,从聚类到分类,都依赖于距离函数来描述数据点之间的关系。对于复杂的数据集,在定义距离函数时很难避免做出一些任意的选择。要比较图像,必须为信号选择一个空间尺度,一个时间尺度。正确的比例很难确定,如果结果不太依赖于所选的精确值,则最好使用正确的比例。拓扑数据分析通过关注邻域而非距离的概念来解决这个问题。结果表明,在某些情况下,可以使用更简单的解决方案。可以使用降维来检查距离关系对超参数的依赖程度。提出了一种动态多维尺度(MDS),它将数据点嵌入为曲线。该算法基于Concave-Convex过程(CCCP),提供了一种简单有效的方法来可视化超参数变化时距离模式中的变化和不变性。还提出了一个变量来分析对多个超参数的依赖性。提供了一个易于实现、使用和扩展的cMDS算法。为了说明cMDS的可能性,将cMDS应用于几个实际数据集。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿加瓦尔,A。;菲利普斯,J.M。;Venkatasubramanian,S.,《通用多维尺度》,(第16届ACM SIGKDD国际知识发现和数据挖掘会议论文集,(2010),ACM),1149-1158
[2] Baur,M。;Schank,T.,面罩中的动态图形绘制,(2008),Citeser
[3] Böhringer,K.F。;Paulisch,F.N.,《使用约束实现自动图形布局算法的稳定性》,(SIGCHI计算机系统人为因素会议论文集,CHI'90,(1990),美国纽约州纽约市ACM),43-51
[4] 博格,I。;Groenen,P.J.F.,(《现代多维尺度:理论与应用》,《统计学中的斯普林格级数》(2005),斯普林格)·Zbl 1085.62079号
[5] Brandes,美国。;Corman,S.R.,网络演化的视觉展开与动态话语分析,Inf.Vis。,2, 1, 40-50, (2003)
[6] Brandes,美国。;Mader,M.,《离线动态图形绘制的应力最小化方法的定量比较》,(Kreveld,M.;Speckmann,B.,《图形绘制,计算机科学讲义》,第7034卷,(2012),斯普林格-柏林,海德堡),99-110·Zbl 1311.68106号
[7] Brandes,美国。;Wagner,D.,动态图形布局的贝叶斯范式,(DiBattista,G.,图形绘制,计算机科学讲义,第1353卷,(1997),施普林格-柏林,海德堡),236-247
[8] 布贾,A。;Swayne,D.F.,多维尺度可视化方法,《分类杂志》,19,1,7-43,(2002)·Zbl 1137.91603号
[9] Buja,A。;Swayne,D.F.博士。;利特曼,M.L。;N.院长。;霍夫曼,H。;Chen,L.,多维尺度数据可视化,J.Compute。图表。统计人员。,17, 2, 444-472, (2008)
[10] Carlsson,G.,Topology and data,布尔。阿默尔。数学。Soc.,46,2,255-308,(2009年)·Zbl 1172.62002号
[11] Chen,L。;Buja,A.,《非线性降维、图形绘制和邻近分析的局部多维标度》,J.Amer。统计师。协会,104,485,209-219,(2009)·Zbl 1388.62182号
[12] 库克,D。;Swayne,D.F.,《用于数据分析的交互式和动态图形:与R和ggobi》,(2007年),施普林格出版社·Zbl 1154.62006年
[13] De Leeuw,J.,凸分析在多维标度中的应用,(Barra,J.R.;Brodeau,F.;Romier,G.;van Cutsem,B.,《统计学的最新发展》,(1977年),荷兰阿姆斯特丹北霍兰德),133-145·Zbl 0372.62083号
[14] De Leeuw,J.,多维缩放的多数化方法的收敛性,J.分类,5,2163-180,(1988)·Zbl 0692.62056号
[15] De Leeuw,J。;Heiser,W.J.,多维尺度校正矩阵算法的收敛性,(关系数据的几何表示,(1977)),735-752
[16] De Leeuw,J。;Patrick,M.,使用优化的多维缩放:R中的SMACOF,J.Stat.Softw。,31, 3, 1-30, (2009)
[17] 迪尔,S。;Görg,C.,《图形,它们正在改变》(Goodrich,M.;Kobourov,S.,《图形绘制,计算机科学讲义》,第2528卷,(2002),斯普林格·柏林,海德堡),23-31·Zbl 1037.68577号
[18] 德怀尔,T。;Hong,S.H。;Koschützki,D。;Schreiber,F。;Xu,K.,网络中心性的可视化分析,(2006年亚太信息可视化研讨会论文集,第60卷,APVis'06,(2006),澳大利亚计算机学会,澳大利亚达林赫斯特),189-197
[19] Erten,C。;Harding,P.J。;Kobourov,S.G。;Wampler,K。;Yee,G.,《利用时间图形可视化探索计算文献》,(Erbacher,Robert F.;Chen,Philip C.;Roberts,Jonathan C.;Gröhn,Matti T.;Börner,Katy.,《可视化和数据分析2004》,《SPIE学报》,第5295卷,(2004)),45-56
[20] Erten,C。;科波罗夫,S。;勒·V。;Navabi,A.,同时绘图:布局算法和可视化方案,(Liotta,G.,绘图,计算机科学讲义,第2912卷,(2004),施普林格柏林,海德堡-柏林,海德堡),437-449,第41章·Zbl 1215.05186号
[21] Y.弗里希曼。;Tal,A.,《在线动态图形绘制》,IEEE Trans。视觉。计算。图形,14,4,727-740,(2008)
[22] 甘斯纳,E。;Koren,Y。;North,S.,《压力控制下的图形绘制》,(Pach,J.,《图形绘制,计算机科学课堂讲稿》,第3383卷,(2005),斯普林格-柏林,海德堡),239-250·Zbl 1111.68580号
[23] Gower,J.C.,《多元分析中潜在根和向量方法的一些距离特性》,生物特征,53,3-4,325-338,(1966)·Zbl 0192.26003号
[24] Guttman,L.,一种求点配置的最小坐标空间的通用非度量技术,《心理测量学》,33,4,469-506,(1968)·Zbl 0205.49302号
[25] 哈格曼,P。;Cammoun,L。;Giganet,X。;Meuli,R。;亲爱的,C.J。;韦丁,V.J。;《绘制人类大脑皮层的结构核心》,《公共科学图书馆·生物学》。,6、7、e159+(2008)
[26] 哈格曼,P。;Thiran,J.P。;Jonasson,L。;范德盖恩斯特,P。;克拉克,S。;梅德,P。;Meuli,R.,《人脑连接的DTI映射:统计纤维追踪和虚拟解剖》,《神经影像》,第19、3、545-554页,(2003年)
[27] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》(2009),施普林格出版社·Zbl 1273.62005年
[28] 亨特·D·R。;Lange,K.,MM算法教程,Amer。统计人员。,58, 1, 30-37, (2004)
[29] Kamada,T。;Kawai,S.,绘制一般无向图的算法,Inform。过程。莱特。,31,1,7-15,(1989年)·Zbl 0679.68128号
[30] Kaski,S。;Peltonen,J.,数据可视化的降维[应用角],IEEE信号处理。杂志,28,210-104,(2011)
[31] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利·Zbl 1345.62009号
[32] Kruskal,J.B.,通过优化非计量假设的拟合优度实现多维标度,《心理测量学》,29,1,1-27,(1964)·Zbl 0123.36803号
[33] 兰克里特,G.R。;Sriperumbudur,B.K.,《关于凹-凸过程的收敛性》,(Bengio,Y.;Schuurmans,D.;Lafferty,J.D.;Williams,C.K.I.;Culotta,A.,《神经信息处理系统进展》第22卷,(2009),Curran Associates,Inc.),1759-1767
[34] Leeuw,J.,《统计学中的块重松弛算法》,(Bock,H.H.;Lenski,W.;Richter,M.,《信息系统和数据分析,分类、数据分析和知识组织研究》(1994),斯普林格-柏林,海德堡),308-324·Zbl 0829.65144号
[35] Lum,P.Y。;辛格,G。;雷曼公司。;Ishkanov,T。;Vejdemo-Johansson,M。;Alagapan,M。;卡尔森,J。;Carlsson,G.,《使用拓扑从复杂数据的形状中提取见解》,科学。代表,3,(2013)
[36] McGee,V.E.,“弹性”距离的多维分析,英国数学杂志。统计师。心理学,19,181-196,(1966)
[37] Misue,K。;伊德斯,P。;赖,W。;Sugiyama,K.,《布局调整和心理地图》,J.Vis。语言计算。,6, 2, 183-210, (1995)
[38] Mizuta,M.,具有连续参数的不同函数的多维标度(函数数据分析),日本社会计算杂志。统计人员。,15, 2, 327-333, (2003) ·Zbl 1330.62034号
[39] 莫克贝尔,B。;卢克斯,W。;Gisbrecht,A。;Hammer,B.,可视化降维质量,神经计算,112,109-123,(2013)
[40] 穆迪,J。;麦克法兰,D。;BenderdeMoll,S.,《动态网络可视化》,美国社会学杂志。,1101206-1241,(2005)
[41] North,S.,《dynadag中的增量布局》,(Brandenburg,F.,图形绘制,计算机科学讲稿,第1027卷,(1996),施普林格-柏林,海德堡),409-418
[42] Powell,M.J.,《最小化算法的搜索方向》,数学。程序。,4, 1, 193-201, (1973) ·兹比尔0258.90043
[43] Ramsay,J.O.,多维尺度分析的置信区间,《心理测量学》,43,2,145-160,(1978)·Zbl 0384.62045号
[44] Ramsay,J.O.,《多尺度:用最大似然法进行多维尺度计算的四个程序》。[用户指南]。国家教育资源;1978年b。
[45] Ramsay,J.O.,多维标度中的最大似然估计,《心理测量学》,42,2,241-266,(1997)·Zbl 0362.92019号
[46] 拉扎维亚因,M。;洪,M。;罗志清,非光滑优化分块逐次极小化方法的统一收敛性分析,SIAM J.Optim。,23, 2, 1126-1153, (2013) ·Zbl 1273.90123号
[47] Rockafellar,R.T.,(凸分析,(普林斯顿数学系列),46,(1970),普林斯顿大学出版社),49·Zbl 0193.18401号
[48] Sammon,J.W.,《数据结构分析的非线性映射》,IEEE Trans。计算。,100, 5, 401-409, (1969)
[49] Sarkar,P。;Moore,A.W.,使用潜在空间模型进行动态社交网络分析,SIGKDD Exp.Newsl。,2005年7月2日,31-40
[50] Schölkopf,B。;Smola,A.J.,《使用内核学习:支持向量机正则化、优化及超越》,(2002年),麻省理工学院出版社
[51] Shepard,R.N.,《邻近性分析:具有未知距离函数的多维标度》。一、 《心理测量学》,27,2,125-140,(1962)·Zbl 0129.12103号
[52] 席尔瓦,V.D。;Tenenbaum,J.B.,非线性降维中的全局与局部方法,高级神经信息处理。系统。,15, 705-712, (2003)
[53] 孢子,O。;托诺尼,G。;Kötter,R.,《人类连接体:人脑的结构描述》,《公共科学图书馆·计算》。生物,1,4,e42+,(2005)
[54] Tenenbaum,J.B。;德席尔瓦,V。;Langford,J.C.,《非线性降维的全球几何框架》,《科学》,2905500,(2000)
[55] 托格森,W.,《多维尺度:I.理论与方法》,《心理测量学》,17,4,401-419,(1952)·Zbl 0049.37603号
[56] Torgerson,W.S.,缩放理论和方法,(1958),威利
[57] 曾,P。;Yun,S.,非光滑可分离极小化的坐标梯度下降法,数学。程序。,117, 1-2, 387-423, (2009) ·Zbl 1166.90016号
[58] Wright,S.,坐标下降算法,数学。程序。,151,1,3-34,(2015)·Zbl 1317.49038号
[59] Xu,K。;克里格,M。;Hero,A.,动态网络可视化的正则化图形布局框架,Data Min.Knowl。发现。,27, 1, 84-116, (2013) ·Zbl 1298.68282号
[60] Yen,I.E.,Peng,N.,Wang,P.,Lin,S.,2012年。关于凹-凸过程的收敛速度。摘自:NIPS 2012优化研讨会会议记录。
[61] Yuille,A.L。;Rangarajan,A.,凹-凸过程,神经计算。,15, 4, 915-936, (2003) ·Zbl 1022.68112号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。