×

具有较少随机比特的低内存遗忘(张量)子空间嵌入:最小二乘法的模式方法。 (英文) Zbl 07331678号

摘要:本文提出了一种新的广义模态Johnson-Lindenstraus(JL)子空间嵌入方法,与传统JL嵌入方法相比,该方法在处理超大向量和/或张量时生成速度更快,存储更容易。然后对两种不同类型的低维(张量)子空间证明了相应的嵌入结果。第一个新的子空间嵌入结果为秩-(r)张量的嵌入提供了改进的空间复杂度界,其CP分解包含在固定(但未知)秩-基张量集的跨度中。在传统的向量设置中,第一个结果产生了新的和非常普遍的接近最优的遗忘子空间嵌入构造,当嵌入由具有特殊Kronecker结构的基向量跨越的\(\mathbb{C}^N\)的子空间时,该构造比标准JL嵌入需要更少的随机位来生成。本文证明的第二个结果提供了新的任意维子空间(mathcal{S}\subset\mathbb{C}^N)的快速JL嵌入,与标准快速JL嵌入式方法相比,它还需要更少的随机比特(因此更容易存储,即需要更少的空间),以实现较小的(epsilon)失真。这些新的不经意子空间嵌入结果的工作原理是:(i)有效地将(mathcal{S})中的任何给定向量折叠成(不一定是低秩)张量,然后(ii)将所得张量嵌入(m\leqCr\log^C(N)/\epsilon^2)的(mathbb{C}^m)。还考虑了与压缩和快速压缩最小二乘解方法相关的应用,包括用于拟合低阶CP分解的方法,并且所提出的JL嵌入结果在两种情况下都能很好地进行数值计算。

MSC公司:

65层55 低阶矩阵逼近的数值方法;矩阵压缩
87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿尔茨海默病神经成像计划,http://adni.loni.usc.edu/。
[2] D.Achlioptas,《数据库友好随机投影:Johnson-Lindenstraus与二进制硬币》,J.Compute。系统科学。,66(2003),第671-687页·Zbl 1054.68040号
[3] T.D.Ahle、M.Kapralov、J.B.T.Knudsen、R.Pagh、A.Velingker、D.P.Woodruff和A.Zandieh,高阶多项式核的不经意草图绘制,第十四届ACM-SIAM离散算法年会论文集,SIAM,费城,2020年,第141-160页,https://doi.org/10.1137/1.9781611975994.9。 ·Zbl 07304032号
[4] A.Ahmed和J.Romberg,相关信号的压缩复用,IEEE Trans。通知。《理论》,61(2014),第479-498页·兹比尔1359.94049
[5] A.Anandkumar、R.Ge、D.Hsu、S.M.Kakade和M.Telgarsky,学习潜在变量模型的张量分解,J.Mach。学习。Res.,15(2014),第2773-2832页·Zbl 1319.62109号
[6] H.Avron、H.Nguyen和D.Woodruff,多项式核的子空间嵌入,《神经信息处理系统进展》,第27卷,Curran Associates,Inc.,2014年,第2258-2266页。
[7] R.Baraniuk、M.Davenport、R.DeVore和M.Wakin,随机矩阵限制等距性的简单证明,Constr。约,28(2008),第253-263页·Zbl 1177.15015号
[8] R.Basri和D.W.Jacobs,Lambertian反射率和线性子空间,IEEE Trans。模式分析。机器。智力。,25(2003年),第218-233页。
[9] C.Battaglino、G.Ballard和T.G.Kolda,实用随机CP张量分解,SIAM J.矩阵分析。申请。,39(2018),第876-901页,https://doi.org/10.1137/17M1112303。 ·Zbl 1444.65016号
[10] M.H.Beck、A.Jaõckle、G.A.Worth和H.-D.Meyer,多重配置时间相关Hartree(MCTDH)方法:一种传播波包的高效算法,Phys。代表,324(2000),第1-105页。
[11] J.A.Bengua、H.N.Phien、H.D.Tuan和M.N.Do,彩色图像和视频恢复的有效张量补全:低秩张量序列,IEEE Trans。图像处理。,26(2017),第2466-2479页·Zbl 1409.94036号
[12] S.Bittens、R.Zhang和M.A.Iwen,《结构傅里叶稀疏函数的确定稀疏FFT》,高级计算。数学。,45(2019年),第519-561页·Zbl 1458.42002号
[13] R.Bro和H.A.Kiers,测定PARAFAC模型中组分数量的一种新的有效方法,《化学计量学杂志》,17(2003),第274-286页。
[14] E.J.Candès、X.Li、Y.Ma和J.Wright,稳健主成分分析?,J.ACM,58(2011),11·Zbl 1327.62369号
[15] E.J.Candès和B.Recht,通过凸优化实现精确矩阵补全,Found。计算。数学。,9(2009),第717-772页·Zbl 1219.90124号
[16] E.J.Candès和T.Tao,线性编程解码,IEEE Trans。通知。《理论》,51(2005),第4203-4215页·Zbl 1264.94121号
[17] J.D.Carroll和J.-J.Chang,通过“Eckart-Young”分解的N向泛化分析多维尺度中的个体差异,Psycholometrika,35(1970),第283-319页·Zbl 0202.19101号
[18] M.Charikar、K.Chen和M.Farach-Colton,《在数据流中查找频繁项》,理论。计算。科学。,312(2004),第3-15页·Zbl 1071.68020号
[19] G.Cormode和S.Muthukrishnan,《热门和不热门:动态跟踪最频繁的项目》,ACM Trans。数据库系统。,30(2005),第249-278页。
[20] A.Dasgupta、R.Kumar和T.Sarloás,稀疏Johnson-Lindenstraus变换,载于《第四十二届ACM计算理论研讨会论文集》,ACM,2010年,第341-350页·Zbl 1293.68140号
[21] V.De Silva和L.-H.Lim,张量秩和最佳低秩逼近问题的适定性,SIAM J.矩阵分析。申请。,30(2008),第1084-1127页,https://doi.org/10.1137/06066518X。 ·Zbl 1167.14038号
[22] Y.C.Eldar和G.Kutyniok,《压缩传感:理论与应用》,剑桥大学出版社,2012年。
[23] S.Foucart和H.Rauhut,压缩传感数学导论,应用。数字。哈蒙。分析。,Birkhaõuser/Spriger,2013年·Zbl 1315.94002号
[24] A.C.Gilbert、P.Indyk、M.Iwen和L.Schmidt,稀疏傅里叶变换的最新发展:大数据的压缩傅里叶转换,IEEE信号处理。Mag.,31(2014),第91-100页。
[25] A.C.Gilbert、M.A.Iwen和M.J.Strauss,《群测试和稀疏信号恢复》,载《2008年第42届Asilomar信号、系统和计算机会议论文集》,IEEE,2008年,第1059-1063页。
[26] D.Gross、Y.-K.Liu、S.T.Flammia、S.Becker和J.Eisert,《压缩传感量子态层析成像》,Phys。修订稿。,105 (2010), 150401.
[27] R.A.Harshman,《PARAFAC程序的基础:“解释性”多模态因子分析的模型和条件》,技术报告,加利福尼亚大学洛杉矶分校,1970年。
[28] M.A.Iwen和B.W.Ong,用于大型网络聚集数据分析的分布式增量SVD算法,SIAM J.Matrix Anal。申请。,37(2016),第1699-1718页,https://doi.org/10.1137/16M1058467。 ·Zbl 1349.15041号
[29] M.A.Iwen,组合次线性时间傅里叶算法,Found。计算。数学。,10(2010年),第303-338页·Zbl 1230.65145号
[30] M.A.Iwen,次线性时间傅立叶算法的改进近似保证,应用。计算。哈蒙。分析。,34(2013),第57-82页·Zbl 1260.65115号
[31] M.A.Iwen,《稀疏二进制矩阵压缩感知:近最优时间内的实例最优误差保证》,J.Complex。,30(2014),第1-15页·Zbl 1294.65045号
[32] R.Jin、T.G.Kolda和R.Ward,《通过Kronecker产品实现更快的Johnson-Lindenstraus转换》,预印本,https://arxiv.org/abs/1909.04801, 2019.
[33] W.B.Johnson和J.Lindenstrauss,Lipschitz映射到Hilbert空间的扩展,《现代分析与概率会议论文集》(康涅狄格州纽黑文,1982),康涅狄格朗普。数学。26,美国。数学。Soc.,1984年,第189-206页·Zbl 0539.46017号
[34] D.M.Kane和J.Nelson,Sparser Johnson Lindenstrauss变换,J.ACM,61(2014),4·Zbl 1295.68134号
[35] T.G.Kolda,正交张量分解,SIAM J.矩阵分析。申请。,23(2001),第243-255页,https://doi.org/10.1137/S08954798003654。 ·Zbl 1005.15020号
[36] T.G.Kolda和B.W.Bader,张量分解和应用,SIAM Rev.,51(2009),第455-500页,https://doi.org/10.1137/07070111X。 ·Zbl 1173.65029号
[37] F.Krahmer和R.Ward,《通过受限等距特性的新的和改进的Johnson-Lindenstraus嵌入》,SIAM J.Math。分析。,43(2011),第1269-1281页,https://doi.org/10.1137/100810447。 ·Zbl 1247.15019号
[38] K.G.Larsen和J.Nelson,Johnson-Lindenstraus引理的最优性,载于2017年IEEE第58届计算机科学基础年会(FOCS)会议记录,IEEE,2017年,第633-638页。
[39] X.Li,J.Haupt和D.Woodruff,低阶张量回归的近最优草图绘制,《神经信息处理系统进展》,第30卷,Curran Associates,Inc.,2017年,第3466-3476页。
[40] J.Liu、P.Musialski、P.Wonka和J.Ye,估计视觉数据中缺失值的张量补全,IEEE Trans。模式分析。机器。智力。,35(2012),第208-220页。
[41] C.Lubich,《从量子到经典分子动力学:简化模型和数值分析》,苏尔。勒克特。高级数学。,欧洲数学学会,祖里奇,2008年·Zbl 1160.81001号
[42] O.A.Malik和S.Becker,使用张量草图对大张量进行低秩Tucker分解,《神经信息处理系统进展》,第31卷,Curran Associates,Inc.,2018,第10096-10106页。
[43] O.A.Malik和S.Becker,使用相干和采样参数保证Kronecker快速Johnson-Lindenstraus变换,预印本,https://arxiv.org/abs/1911.08424, 2019. ·兹比尔1444.15009
[44] S.Merhi、R.Zhang、M.A.Iwen和A.Christlieb,《一类新的全离散稀疏傅里叶变换:有保证的更快稳定实现》,J.Fourier Ana。申请。,25(2019年),第751-784页·Zbl 1431.65253号
[45] R.Pagh,压缩矩阵乘法,ACM Trans。计算。理论,5(2013),第1-17页·Zbl 1322.65055号
[46] N.Pham和R.Pagh,《通过显式特征映射实现快速可伸缩多项式核》,载于《第19届ACM SIGKDD国际知识发现和数据挖掘会议论文集》,ACM,2013年,第239-247页。
[47] B.T.Rakhshan和G.Rabusseau,张力随机投影,预印本https://arxiv.org/abs/2003.05101,2020年。
[48] H.Rauhut、R.Schneider和Ž。Stojanac,通过迭代硬阈值的低秩张量恢复,线性代数应用。,523(2017),第220-262页·Zbl 1372.65130号
[49] B.Recht、M.Fazel和P.A.Parrilo,通过核范数最小化保证线性矩阵方程的最小秩解,SIAM Rev.,52(2010),第471-501页,https://doi.org/10.1137/070697835。 ·Zbl 1198.90321号
[50] B.Romera--Paredes、H.Aung、N.Bianchi-Berthouze和M.Pontil,《多线性多任务学习》,摘自《第三十届机器学习国际会议论文集》,佐治亚州亚特兰大,PMLR 282013年,第1444-1452页。
[51] B.Segal和M.Iwen,《改进的稀疏傅里叶近似结果:更快的实现和更强的保证》,Numer。《算法》,63(2013),第239-263页·Zbl 1276.65097号
[52] Y.Shi和A.Anandkumar,《高阶计数素描:保持有效张量运算的降维》,预印本,https://arxiv.org/abs/1901.11261, 2019.
[53] Y.Sun、Y.Guo、J.A.Tropp和M.Udell,低记忆维数缩减的张量随机投影,《关系表征学习神经信息处理系统第32届会议论文集》,加拿大蒙特勒,2018年。
[54] G.Tsitsikas和E.E.Papalexakis,压缩张量的核心一致性,预印本,https://arxiv.org/abs/1111.07428, 2018.
[55] L.R.Tucker,《关于三模式因子分析的一些数学注释》,《心理测量学》,31(1966),第279-311页。
[56] N.Vannieuwenhoven、R.Vandebril和K.Meerbergen,高阶奇异值分解的新截断策略,SIAM J.Sci。计算。,34(2012),第A1027-A1052页,https://doi.org/10.1137/10836067。 ·兹比尔1247.65055
[57] M.A.O.Vasilescu和D.Terzopoulos,《多线性独立元件分析》,载于2005年IEEE计算机学会计算机视觉和模式识别会议(CVPR'05)论文集,第1卷,IEEE,2005年,第547-553页。
[58] R.Vershynin,《高维概率:数据科学应用简介》,剑桥。统计师。普罗巴伯。数学。47,剑桥大学出版社,2018年·Zbl 1430.60005号
[59] R.Vershynin,随机张量的集中不等式,预印本,https://arxiv.org/abs/1905.00802, 2019. ·Zbl 1472.60041号
[60] Y.Wang、H.-Y.Tung、A.J.Smola和A.Anandkumar,通过草图快速保证张量分解,收录于《NIPS’15:第28届神经信息处理系统国际会议论文集》,加拿大蒙特勒,2015年第1卷,第991-999页。
[61] A.Zare、A.Ozdemir、M.A.Iwen和S.Aviyente,主成分分析到高阶数据结构的扩展:张量、张量分解和张量主成分分析的介绍,Proc。IEEE,106(2018),第1341-1358页。
[62] 张浩、何文华、张磊、沈浩和袁庆,利用低阶矩阵恢复高光谱图像,IEEE Trans。地质科学。遥感,52(2013),第4729-4743页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。