×

快速度量嵌入到汉明立方体中。 (英语) Zbl 07820562号

摘要:我们考虑以几乎等距的方式将(mathbb{R}^n)的子集嵌入到低维Hamming立方体中的问题。我们构造了一个简单的、数据透明的、计算效率高的映射,以高概率完成此任务;我们首先应用一个特定的结构化随机矩阵,我们称之为双循环矩阵; 使用这种方法,矩阵需要线性存储和矩阵-向量乘法,可以在近线性时间内执行。然后,我们通过将每个向量的条目与随机阈值进行比较,将每个向量二值化,该阈值是从一个精心选择的间隔中随机选择的。我们根据集合的两个自然几何复杂性参数(欧几里德覆盖数和局部高斯复杂性)估计该编码方案所需的比特数。我们得出的估计结果是我们所能期望的最好的,达到对数项。证明的关键是一个独立有趣的现象:我们证明了双循环矩阵在两个重要方面模拟了高斯矩阵的行为。首先,它将(mathbb{R}^n)中的任意集映射为一组分布良好的向量。其次,它将(ell_2^n)的任何有限子集快速地近等距嵌入到(ell_1^m)中。这种嵌入在近线性时间内实现了与高斯矩阵相同的降维,在最佳条件下(最多为对数因子)嵌入的点数。这改善了Ailon和Chazelle的知名结构。

MSC公司:

68兰特 与计算问题和算法相关的度量嵌入
60对20 随机矩阵(概率方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achlioptas,D.,《数据库友好随机投影:Johnson-Lindenstraus与二进制硬币》,J.Compute。系统科学。,66(2003),第671-687页·Zbl 1054.68040号
[2] Ailon,N.和Chazelle,B.,《快速Johnson-Lindenstraus变换和近似最近邻》,SIAM J.Compute。,39(2009),第302-322页·兹比尔1185.68327
[3] Ailon,N.和Liberty,E.,在双BCH码上使用Rademacher级数进行快速降维,离散计算。地理。,42(2009),第615-630页·Zbl 1180.94083号
[4] Alon,N.和Klartag,B.,《近似内积的最佳压缩和降维》,2017年IEEE第58届计算机科学基础年度研讨会(FOCS),IEEE计算机学会,加利福尼亚州洛斯阿拉米托斯,2017,第639-650页。
[5] Bamberger,S.和Krahmer,F.,大型数据集的最佳快速Johnson-Lindenstraus嵌入,Sampl。理论信号处理。数据分析。,19(2021),第1-23页·Zbl 1479.94054号
[6] Bourgain,J.、Dirksen,S.和Nelson,J.,《欧几里德空间稀疏降维统一理论》,Geom。功能。分析。,25(2015),第1009-1088页·Zbl 1341.46007号
[7] Boyd,S.P.和Vandenberghe,L.,《凸优化》,剑桥大学出版社,剑桥,2004年·Zbl 1058.90049号
[8] Carl,B.,《Bernstein-Jackson型不等式与Banach空间中算子的紧度》,《傅里叶研究年鉴》,第35卷,1985年,第79-118页·Zbl 0564.47009号
[9] Clarkson,K.L.和Woodruff,D.P.,流模型中的数值线性代数,第41届ACM计算理论研讨会论文集,STOC 2009,Bethesda,MD,ACM,纽约,2009,第205-214页·Zbl 1304.65138号
[10] Dasgupta,A.、Kumar,R.和Sarlós,T.,《稀疏Johnson-Lindenstraus变换》,载于《第42届ACM计算理论研讨会(STOC)论文集》,ACM,纽约,2010年,第341-350页·Zbl 1293.68140号
[11] Dirksen,S.,通过通用链的尾部边界,Electron。J.概率。,20(2015),第1-29页·Zbl 1327.60048号
[12] Dirksen,S.、Jung,H.C.和Rauhut,H.,部分高斯循环矩阵的一位压缩传感,Inf.推理,9(2020),第601-626页·Zbl 1470.94037号
[13] Dirksen,S.和Mendelson,S.,《部分循环矩阵的鲁棒一位压缩感知》,《Ann.Appl。可能性。,33(2023年),第1874-1903页·Zbl 1515.94023号
[14] Dirksen,S.、Mendelson,S.和Stollenwerk,A.,随机超平面细分的Sharp估计,SIAM J.Math。数据科学。,4(2022年),第1396-1419页·Zbl 1510.60008号
[15] Dirksen,S.和Stollenwerk,A.,高斯循环矩阵的快速二进制嵌入:改进边界,离散计算。地理。,60(2018年),第599-626页·Zbl 1409.60023号
[16] Fandina,O.N.、Högsgaard,M.M.和Larsen,K.G.,《快速Johnson-Lindenstraus转换更快》,载于《第40届机器学习国际会议(PMLR)论文集》,202(2023),第9689-9715页。
[17] Freksen,C.B.和Larsen,K.G.,《关于使用Toeplitz和循环矩阵进行Johnson-Lindenstraus变换》,《算法》,82(2020),第338-354页·Zbl 1434.68603号
[18] Gordon,Y.,《关于Milman不等式和通过网格逃逸的随机子空间》,摘自《函数分析的几何方面》,Springer,Berlin,1988年,第84-106页。
[19] Har Peled,S.、Indyk,P.和Motwani,R.,《近似近邻:消除维度诅咒》,理论计算。,8(2012年),第321-350页·Zbl 1278.68344号
[20] Hinrichs,A.和Vybíral,J.,循环矩阵的Johnson-Lindenstraus引理,随机结构算法,39(2011),第391-398页·Zbl 1230.46019号
[21] Huynh,T.和Saab,R.,具有结构化矩阵的快速二进制嵌入和量化压缩传感,Comm.Pure Appl。数学。,73(2020年),第110-149页·Zbl 1452.94016号
[22] Indyk,P.,《低失真几何嵌入的算法应用》,载于《第42届计算机科学基础年度研讨会论文集》,IEEE计算机学会,加利福尼亚州洛斯阿拉米托斯,2001年,第10-33页。
[23] Indyk,P.,《不确定性原理、提取器和l2到l1的显式嵌入》,载于《第三十九届美国计算机学会计算理论研讨会论文集》,美国计算机学会,纽约,2007年,第615-620页·Zbl 1232.68165号
[24] Indyk,P.和Wagner,T.,《近最优(欧几里德)度量压缩》,载于《第二十八届ACM-SIAM离散算法研讨会论文集》,SIAM,费城,2017年,第710-723页·Zbl 1410.68369号
[25] Indyk,P.和Wagner,T.,最优(欧几里德)度量压缩,SIAM J.计算。,51(2022年),第467-491页·Zbl 07534658号
[26] Jacques,L.,量子化Johnson-Lindenstraus引理:布冯针的发现,IEEE Trans。通知。《理论》,61(2015),第5012-5027页·Zbl 1359.81065号
[27] Jacques,L.,《小宽度,低失真:低复杂度集的量化随机嵌入》,IEEE Trans。通知。《理论》,63(2017),第5477-5495页·Zbl 1374.94520号
[28] Jacques,L.和Cambareri,V.,抖动时间:通过受限等距特性的快速量化随机嵌入,Inf.推理,6(2017),第441-476页·Zbl 1386.94031号
[29] Jacques,L.、Laska,J.N.、Boufounos,P.T.和Baraniuk,R.G.,通过稀疏向量的二进制稳定嵌入实现稳健的1位压缩感知,IEEE Trans。通知。《理论》,59(2013),第2082-2102页·Zbl 1364.94130号
[30] Jain,V.、Pillai,N.S.、Sah,A.、Sawhney,M.和Smith,A.,《使用Kac’S walk的快速和内存优化降维》,Ann.Appl。可能性。,32(2022年),第4038-4064页·Zbl 07609689号
[31] Johnson,W.B.和Lindenstrauss,J.,Lipschitz映射到Hilbert空间的扩展,Contemp。数学。,26(1984年),第189-206页·Zbl 0539.46017号
[32] Kane,D.M.和Nelson,J.,Sparser Johnson-Lindenstraus transforms,J.ACM,61(2014),4·Zbl 1295.68134号
[33] Krahmer,F.、Mendelson,S.和Rauhut,H.,混沌过程的Suprema和受限等距性质,Comm.Pure Appl。数学。,67(2014),第1877-1904页·Zbl 1310.94024号
[34] Krahmer,F.和Ward,R.,通过限制等距性质的新的和改进的Johnson-Lindenstrauss嵌入,SIAM J.Math。分析。,43(2011),第1269-1281页·Zbl 1247.15019号
[35] Larsen,K.G.和Nelson,J.,Johnson-Lindenstraus引理的最优性,2017年IEEE第58届计算机科学基础年会(FOCS),IEEE计算机学会,加利福尼亚州洛斯阿拉米托斯,2017年,第633-638页。
[36] Ledoux,M.和Talagrand,M.,《巴拿赫空间中的概率》,施普林格,柏林,1991年·兹比尔074860004
[37] Makarychev,K.、Makaryschev,Y.和Razenshteyn,I.,《Johnson-Lindenstraus变换在K-means和K-medians聚类中的性能》,载于《第51届ACM SIGACT计算机理论研讨会论文集》,ACM,纽约,2019年,第1027-1038页·Zbl 1433.68366号
[38] Mendelson,S.,《柱随机化和几乎定量嵌入》,《Inf.推断》,12(2023),第1-25页·Zbl 1508.60007号
[39] Oymak,S.和Recht,B.,任意集二进制嵌入的近最优边界,预印本,arXiv:1512.044332015。
[40] Oymak,S.、Recht,B.和Soltanolkotabi,M.,通过受限等距特性绘制任意集合的等距草图,Inf.Inference,7(2018),第707-726页·Zbl 1473.60021号
[41] Oymak,S.、Thrampoulidis,C.和Hassibi,B.,循环二进制嵌入的近最优样本复杂度界限,IEEE声学、语音和信号处理国际会议(ICASSP),IEEE,新泽西州皮斯卡塔韦,2017年,第6359-6363页。
[42] Plan,Y.和Vershynin,R.,通过随机超平面细分进行降维,离散计算。地理。,51(2014),第438-461页·Zbl 1296.52014年
[43] Talagrand,M.,《随机过程的上下限》,Springer,Heidelberg,2014年·Zbl 1293.60001号
[44] Tropp,J.A.、Yurtsever,A.、Udell,M.和Cevher,V.,《流式低秩矩阵近似及其在科学模拟中的应用》,SIAM J.Sci。计算。,41(2019年),第A2430-A2463页·兹比尔1420.65060
[45] Vybíral,J.,循环矩阵的Johnson-Lindenstraus引理的一个变体,J.Funct。分析。,260(2011),第1096-1105页·Zbl 1220.46015号
[46] 伍德拉夫,D.P.,《素描作为数字线性代数的工具》,Found。趋势理论。计算。科学。,10(2014),第1-157页·Zbl 1316.65046号
[47] Yi,X.、Caramanis,C.和Price,E.,《二进制嵌入:基本极限和快速算法》,第32届机器学习国际会议论文集,37(2015),第2162-2170页。
[48] Yu,F.X.,Bhaskara,A.,Kumar,S.,Gong,Y.,and Chang,S.-F.,《关于使用循环矩阵的二进制嵌入》,J.Mach。学习。决议,18(2018),第1-30页·Zbl 1462.68172号
[49] Zhang,J.和Saab,R.,《保存欧几里德距离的快速二进制嵌入》,预印本,arXiv:2010.00712,2020年。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。