大卫·加马尼克;李泉 求高斯随机矩阵的一个子矩阵。 (英语) Zbl 1401.68120号 Ann.统计。 46,No.6A,2511-2561(2018). 摘要:我们考虑了用i.i.d.标准高斯项(平均项较大)求(n次n)矩阵的(k次k)子矩阵的问题。它显示在[S.巴米迪等,Probab。理论关联。Fields 168,No.3–4,919–983(2017;Zbl 1371.60010号)]使用非构造方法,当(k=o(log n/log n))时,a(k乘以k)子矩阵的最大平均值为(2(1+o(1))\sqrt{\log n/k},具有高概率(w.h.p.)。在同一篇论文中,有证据表明,一种称为常数(k)的最大平均子矩阵(Largest Average Submatrix,LAS})的自然贪婪算法应该产生一个平均项最多为(1+o(1))的矩阵,即大约小于全局最优值的(sqrt{2}),尽管没有提供这一事实的正式证明。{}本文证明了当(k)为常数且(n)增长时,(mathcal{LAS})算法产生的矩阵的平均项确实是((1+o(1))sqrt{2\log n/k})w.h.p。然后,通过与随机图中的寻找集团问题进行类比,我们提出了一个简单的贪婪算法,该算法产生一个具有渐近相同平均值的\(k+o(1))\sqrt{2\logn/k}\)w.h.p.的\(k=o(\logn)\)矩阵。由于贪婪算法是在随机图中查找团的最著名的算法,人们很容易相信,克服这两种算法所遭受的因子(sqrt{2})性能差距可能是非常困难的。令人惊讶的是,我们构造了一个非常简单的算法,它为(k=o((logn)^{1.5})生成了一个平均值为(1+o{k}(1)+o(1))(4/3)的矩阵,也就是说,当(k)增长时,其渐近因子为(4/3。{}为了深入了解这个问题的算法难度,并受到自旋玻璃理论中方法的启发,我们对具有固定值的平均值渐近((1+o(1))alpha\sqrt{2\log n/k})的矩阵进行了所谓的期望重叠分析。重叠对应于实现该值的矩阵对的公共行数和公共列数(有关详细信息,请参阅本文)。我们在数值上发现了一个有趣的相变:当(α)重叠空间是([0,1]^{2})的连续子集时,而(α)标志着不连续的开始,因此,模型在适当定义的\(\alpha>\alpha^\ast\)时显示了重叠间隙特性(OGP)。我们推测,观察到的(alpha>alpha^\ast)OGP也标志着算法硬度的开始——不存在多项式时间算法来寻找平均值至少为\(1+o(1))\alpha\sqrt{2\log n/k}的矩阵,而\(alpha>alpha^\ ast)和\(k)是\(n)的轻度增长函数。 引用于6文件 MSC公司: 65年第68季度 算法和问题复杂性分析 60对20 随机矩阵(概率方面) 60二氧化碳 组合概率 87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等) 关键词:随机矩阵;随机图;最大集团;子矩阵检测;计算复杂度;重叠间隙特性 引文:Zbl 1371.60010号 软件:拉斯 PDF格式BibTeX公司 XML格式引用 \textit{D.Gamarnik}和\textit{Q.Li},Ann.Stat.46,No.6A,2511--2561(2018;Zbl 1401.68120) 全文: 内政部 arXiv公司 欧几里得 参考文献: [1] Achlioptas,D.和Coja-Oghlan,A.(2008)。来自相变的算法障碍。2008年第49届IEEE计算机科学基础年会793–802。IEEE,纽约。 [2] Achlioptas,D.、Coja-Oghlan,A.和Ricci-Tersenghi,F.(2011年)。关于随机约束满足问题的解空间几何。随机结构算法38 251–268·Zbl 1217.68156号 ·doi:10.1002/rsa.20323 [3] Alon,N.、Krivelevich,M.和Sudakov,B.(1998年)。在随机图中找到一个大的隐藏集团。随机结构算法13 457–466·Zbl 0959.05082号 ·doi:10.1002/(SICI)1098-2418(199810/12)13:3/4<457::AID-RSA14>3.0.CO;2伏 [4] Berthet,Q.和Rigollet,P.(2013)。稀疏主成分检测的复杂性理论下限。学习理论会议1046–1066。 [5] Berthet,Q.和Rigollet,P.(2013)。高维稀疏主成分的最优检测。《统计年鉴》41 1780年至1815年·Zbl 1277.62155号 ·doi:10.1214/13-AOS1127 [6] 巴米迪,S.、戴伊,P.S.和诺贝尔,A.B.(2012)。高斯随机矩阵中大平均子矩阵检测问题的能量景观。预印本。可在arXiv:12121.2284上获得·Zbl 1371.60010号 ·doi:10.1007/s00440-017-0766-0 [7] Coja-Oghlan,A.和Efthymiou,C.(2011年)。关于随机图中的独立集。第二十二届ACM-SIAM离散算法研讨会论文集136-144。费城SIAM·Zbl 1376.05139号 [8] Fortunato,S.(2010年)。图中的社区检测。物理学。代表486 75–174。 [9] Gamarnik,D.和Sudan,M.(2014)。稀疏随机图上局部算法的极限。第五届理论计算机科学创新会议论文集369-376。纽约ACM·Zbl 1365.05277号 [10] Gamarnik,D.和Sudan,M.(2014)。随机NAE-K-SAT问题的调查传播引导抽取算法的性能。预打印。可从arXiv:1402.0052获取。 [11] Gamarnik,D.和Zadik,I.(2017年)。二元系数的高维回归。估计平方误差和相变。预印本。可从arXiv:1701.04455获得。 [12] Karp,R.M.(1976年)。一些组合搜索算法的概率分析。算法与复杂性:新方向和最新结果1-19·Zbl 0368.68035号 [13] Leadbetter,M.R.、Lindgren,G.和Rootzén,H.(1983年)。随机序列和过程的极值及其相关性质。纽约州施普林格·Zbl 0518.60021号 [14] Madeira,S.C.和Oliveira,A.L.(2004)。生物数据分析的双聚类算法:综述。IEEE/ACM传输。计算。生物。生物信息。1 24–45。 [15] Montanari,A.(2015)。在稀疏图中查找一个社区。《联邦统计物理杂志》161 273–299·Zbl 1327.82091号 ·doi:10.1007/s10955-015-1338-2 [16] Rahman,M.和Virág,B.(2014)。独立集的局部算法是半最优的。预打印。可从arXiv:1402.0485获取。 [17] Shabalin,A.A.、Weigman,V.J.、Perou,C.M.和Nobel,A.B.(2009年)。在高维数据中发现较大的平均子矩阵。附录申请。统计数字985–1012·Zbl 1196.62087号 ·doi:10.1214/09-AOAS239 [18] Sun,X.和Nobel,A.B.(2013)。关于高斯随机矩阵中大平均和ANOVA-fit子矩阵的最大尺寸。Bernoulli19 275-294·Zbl 1259.62062号 ·文件编号:10.3150/11-BEJ394 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。