×

基于拓扑特性的线性降维方法。 (英语) Zbl 07840259号

摘要:降维是一种重要的数据预处理技术,在机器学习和数据挖掘中得到了广泛的研究。局部保持投影(LPP)是一种广泛使用的线性无监督降维方法,它通过线性变换将高维数据映射到低维子空间。虽然已经提出了LPP的各种变体来解决LPP的不同缺点,但本文发现LPP不具备平移不变性的重要拓扑性质,即:,LPP给出的线性变换与数据与坐标系原点之间的相对位置密切相关。在本文中,我们从理论上分析了LPP中存在此缺陷的原因,并建议通过在模型中引入一种集中化来解决此问题。此外,由于拓扑属性是表征数据结构的重要信息,本文提出了对LPP的进一步改进,以在降维后保持数据的拓扑连通性。在多个合成数据集和真实数据集上的实验表明,结合拓扑特性的新模型不仅优于原始LPP模型,还优于其他几种经典的线性或非线性降维方法。

MSC公司:

68倍 计算机科学
92至XX 生物学和其他自然科学

软件:

t-SNE公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Yan,S。;徐,D。;张,B。;张,H。;杨琼。;Lin,S.,图嵌入与扩展:降维的一般框架,IEEE模式分析与机器智能汇刊,29,1,40-51(2007)
[2] He,R。;熊,N。;Yang,L.T。;Park,J.H.,《使用多模式语义关联规则自动融合关键字和视觉特征以进行web图像检索》,信息融合,12,3,223-230(2011)
[3] 周,R。;王,X。;Wan,J。;Xiong,N.,EDM-Fuzzy:基于欧氏距离的多尺度模糊熵技术在工业系统故障诊断中的应用,IEEE工业信息学汇刊,17,6,4046-4054(2021)
[4] 李,H。;姜涛(Jiang,T.)。;Zhang,K.,基于最大裕度准则的高效稳健特征提取,IEEE神经网络汇刊,17,1,157-165(2006)
[5] Unser,M。;Eden,M.,纹理分割的多分辨率特征提取和选择,IEEE模式分析和机器智能汇刊,11,7,717-728(1989)
[6] 严,J。;张,B。;刘,N。;Yan,S。;Cheng,Q。;风扇,W。;杨琼。;Xi,W。;Chen,Z.,针对大规模和流数据预处理的有效和高效降维,IEEE知识与数据工程汇刊,18,3,320-333(2006)
[7] Blum,A。;Langley,P.,《机器学习中相关特征和示例的选择》,人工智能,97,1-2,245-271(1997)·Zbl 0904.68142号
[8] D.Koller,M.Sahami,走向最佳特征选择,摘自:机器学习国际会议,1996年,第284-292页。
[9] X.He,D.Cai,S.Yan,H.Zhang,邻域保护嵌入,载于:IEEE国际计算机视觉会议,2005年,第1208-1213页。
[10] 卡瓦尔坎蒂,哥伦比亚特区。;Ren,T.I。;Pereira,J.F.,人脸识别的加权模块化图像主成分分析,专家系统与应用,40,12,4971-4977(2013)
[11] E.Silva Jr、A.Oliveira、W.Santos、C.Mello、C.Zanchettin、G.D.C.Cavalcanti,通过遗传算法的特征选择和模型设计应用于历史文档图像的手写数字识别,收录于:手写识别领域国际会议,2008年,第562-567页。
[12] 李,B。;张,D。;王凯,基于零成分分析和主成分分析的在线签名验证,模式分析与应用,8,4,345-356(2006)
[13] Gunduz,H.,使用基于滤波器的特征选择和变分自编码器对帕金森氏病分类的有效降维方法,生物医学信号处理和控制,66,文章102452 pp.(2021)
[14] Han,J。;Ge,Z.,不同市场情况下使用聚类分析进行降维对股票选择的影响,专家系统及其应用,147,第113226条,pp.(2020)
[15] Jolliffe,I.T.,主成分分析,统计学中的Springer级数(1986),Springer
[16] R.A.Johnson,D.W.Wichern,《应用多变量统计分析》,第6卷,皮尔逊伦敦,2014年·Zbl 1269.62044号
[17] 陈,S。;丁,C.H.Q。;Luo,B.,基于线性回归的降维预测,信息科学,467,74-86(2018)·Zbl 1450.62084号
[18] Roweis,S.T。;Saul,L.K.,通过局部线性嵌入降低非线性维数,《科学》,290,5500,2323-2326(2000)
[19] 范德马滕,L。;Hinton,G.,使用t-SNE可视化数据,机器学习研究杂志,9,86,2579-2605(2008)·Zbl 1225.68219号
[20] Balasubramanian,M。;Schwartz,E.L.,Isomap算法和拓扑稳定性,《科学》,295552(2002),7-7
[21] M.Belkin,P.Niyogi,嵌入和聚类的拉普拉斯特征映射和光谱技术,收录于:神经信息处理系统进展,2001年,第585-591页。
[22] 李毅。;Chai,Y。;周,H。;Yin,H.,用于高维数据分类的新型降维和字典学习框架,模式识别,112,文章107793 pp.(2021)
[23] 陈,J。;Liao,L。;张伟。;Du,L.,带距离度量约束的混合因子分析用于降维,模式识别,121,第108156页,(2022)
[24] 彭,X。;徐,D。;Chen,D.,用于降维的基于稳健分布的非负矩阵分解,信息科学,552244-260(2021)·Zbl 1483.68313号
[25] 陈,Z。;傅,A。;Deng,R.H。;刘,X。;Yang,Y。;Zhang,Y.,《基于动态数据的安全和可验证外包数据降维》,信息科学,573182-193(2021)
[26] X.He,P.Niyogi,位置保持预测,收录于:神经信息处理系统进展,2003年,第153-160页。
[27] 李,J。;潘,J。;Chu,S.,《核类-全局局部保持投影》,信息科学,178,7,1825-1835(2008)·Zbl 1133.68398号
[28] 西尔瓦·E·R。;卡瓦尔坎蒂,哥伦比亚特区。;Ren,T.I.,多模态数据的分类特征提取技术,神经计算,2141001-2010(2016)
[29] 桂,J。;贾伟。;朱,L。;王,S。;Huang,D.,用于人脸和掌纹识别的位置保持判别投影,神经计算,73,13-15,2696-2707(2010)
[30] 于伟(Yu,W.)。;滕,X。;Liu,C.,使用判别局部保持投影的人脸识别,图像和视觉计算,24,3,239-248(2006)
[31] 唐勇,张志忠,张勇,李凤,稳健L1-矩阵局部保持投影在区分子空间学习中的应用,载:神经网络国际联合会议,2016年,第4199-4204页。
[32] 于伟(Yu,W.)。;王,R。;聂,F。;Wang,F。;余,Q。;Yang,X.,基于l_1范数最小化的改进局部保持投影在降维中的应用,神经计算,316,322-331(2018)
[33] 王,A。;赵,S。;刘,J。;杨,J。;刘,L。;Chen,G.,线性降维的局部自适应保持投影,应用专家系统,151,第113352页,(2020)
[34] Wasserman,L.,拓扑数据分析,《统计及其应用年刊》,501-532(2018)
[35] I.雪佛兰。;南达,V。;Oberhauser,H.,拓扑数据分析中的持久路径和签名特征,IEEE模式分析和机器智能汇刊,42,1,192-202(2020)
[36] Elhamdadi,H。;卡纳万,S。;Rosen,P.,《情感TDA:使用拓扑数据分析来提高情感计算中的分析和可解释性》,IEEE可视化与计算机图形学汇刊,28,1,769-779(2022)
[37] 郭伟。;马诺哈尔,K。;Brunton,S.L。;Banerjee,A.G.,Sparse-TDA:多路分类拓扑数据分析的稀疏实现,IEEE知识与数据工程学报,30,7,1403-1408(2018)
[38] 冯·T。;达维拉,J.I。;刘,Y。;Lin,S。;黄,S。;Wang,C.,用于阐明高维转录组数据集中隐藏结构的半监督拓扑分析,IEEE/ACM计算生物学和生物信息学汇刊,18,4,1620-1631(2021)
[39] 马,A.J。;袁,P.C。;邹,W.W.W。;Lai,J.,用于动作识别的监督时空邻域拓扑学习,IEEE视频技术电路和系统交易,23,8,1447-1460(2013)
[40] J.R.Munkres,《拓扑》,皮尔逊出版社,2000年。
[41] Cheng博士。;张,S。;Huang,J.,基于局部核的密度峰值聚类算法的稠密成员,基于知识的系统,193,文章105454 pp.(2020)
[42] 迪伦,I.S。;Modha,D.S。;Spangler,W.S.,高维数据的类可视化与应用,计算统计与数据分析,41,1,59-90(2002)·Zbl 1101.62350号
[43] Kwak,N.,基于L1-形式最大化的主成分分析,IEEE模式分析和机器智能学报,30,9,1672-1680(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。