×

求高斯随机矩阵的一个子矩阵。 (英语) Zbl 1401.68120号

摘要:我们考虑了用i.i.d.标准高斯项(平均项较大)求(n次n)矩阵的(k次k)子矩阵的问题。它显示在[S.巴米迪等,Probab。理论关联。Fields 168,No.3–4,919–983(2017;Zbl 1371.60010号)]使用非构造方法,当(k=o(log n/log n))时,a(k乘以k)子矩阵的最大平均值为(2(1+o(1))\sqrt{\log n/k},具有高概率(w.h.p.)。在同一篇论文中,有证据表明,一种称为常数(k)的最大平均子矩阵(Largest Average Submatrix,LAS})的自然贪婪算法应该产生一个平均项最多为(1+o(1))的矩阵,即大约小于全局最优值的(sqrt{2}),尽管没有提供这一事实的正式证明。{}本文证明了当(k)为常数且(n)增长时,(mathcal{LAS})算法产生的矩阵的平均项确实是((1+o(1))sqrt{2\log n/k})w.h.p。然后,通过与随机图中的寻找集团问题进行类比,我们提出了一个简单的贪婪算法,该算法产生一个具有渐近相同平均值的\(k+o(1))\sqrt{2\logn/k}\)w.h.p.的\(k=o(\logn)\)矩阵。由于贪婪算法是在随机图中查找团的最著名的算法,人们很容易相信,克服这两种算法所遭受的因子(sqrt{2})性能差距可能是非常困难的。令人惊讶的是,我们构造了一个非常简单的算法,它为(k=o((logn)^{1.5})生成了一个平均值为(1+o{k}(1)+o(1))(4/3)的矩阵,也就是说,当(k)增长时,其渐近因子为(4/3。{}为了深入了解这个问题的算法难度,并受到自旋玻璃理论中方法的启发,我们对具有固定值的平均值渐近((1+o(1))alpha\sqrt{2\log n/k})的矩阵进行了所谓的期望重叠分析。重叠对应于实现该值的矩阵对的公共行数和公共列数(有关详细信息,请参阅本文)。我们在数值上发现了一个有趣的相变:当(α)重叠空间是([0,1]^{2})的连续子集时,而(α)标志着不连续的开始,因此,模型在适当定义的\(\alpha>\alpha^\ast\)时显示了重叠间隙特性(OGP)。我们推测,观察到的(alpha>alpha^\ast)OGP也标志着算法硬度的开始——不存在多项式时间算法来寻找平均值至少为\(1+o(1))\alpha\sqrt{2\log n/k}的矩阵,而\(alpha>alpha^\ ast)和\(k)是\(n)的轻度增长函数。

MSC公司:

65年第68季度 算法和问题复杂性分析
60对20 随机矩阵(概率方面)
60二氧化碳 组合概率
87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等)

软件:

拉斯
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achlioptas,D.和Coja-Oghlan,A.(2008)。来自相变的算法障碍。2008年第49届IEEE计算机科学基础年会793–802。IEEE,纽约。
[2] Achlioptas,D.、Coja-Oghlan,A.和Ricci-Tersenghi,F.(2011年)。关于随机约束满足问题的解空间几何。随机结构算法38 251–268·Zbl 1217.68156号 ·doi:10.1002/rsa.20323
[3] Alon,N.、Krivelevich,M.和Sudakov,B.(1998年)。在随机图中找到一个大的隐藏集团。随机结构算法13 457–466·Zbl 0959.05082号 ·doi:10.1002/(SICI)1098-2418(199810/12)13:3/4<457::AID-RSA14>3.0.CO;2伏
[4] Berthet,Q.和Rigollet,P.(2013)。稀疏主成分检测的复杂性理论下限。学习理论会议1046–1066。
[5] Berthet,Q.和Rigollet,P.(2013)。高维稀疏主成分的最优检测。《统计年鉴》41 1780年至1815年·Zbl 1277.62155号 ·doi:10.1214/13-AOS1127
[6] 巴米迪,S.、戴伊,P.S.和诺贝尔,A.B.(2012)。高斯随机矩阵中大平均子矩阵检测问题的能量景观。预印本。可在arXiv:12121.2284上获得·Zbl 1371.60010号 ·doi:10.1007/s00440-017-0766-0
[7] Coja-Oghlan,A.和Efthymiou,C.(2011年)。关于随机图中的独立集。第二十二届ACM-SIAM离散算法研讨会论文集136-144。费城SIAM·Zbl 1376.05139号
[8] Fortunato,S.(2010年)。图中的社区检测。物理学。代表486 75–174。
[9] Gamarnik,D.和Sudan,M.(2014)。稀疏随机图上局部算法的极限。第五届理论计算机科学创新会议论文集369-376。纽约ACM·Zbl 1365.05277号
[10] Gamarnik,D.和Sudan,M.(2014)。随机NAE-K-SAT问题的调查传播引导抽取算法的性能。预打印。可从arXiv:1402.0052获取。
[11] Gamarnik,D.和Zadik,I.(2017年)。二元系数的高维回归。估计平方误差和相变。预印本。可从arXiv:1701.04455获得。
[12] Karp,R.M.(1976年)。一些组合搜索算法的概率分析。算法与复杂性:新方向和最新结果1-19·Zbl 0368.68035号
[13] Leadbetter,M.R.、Lindgren,G.和Rootzén,H.(1983年)。随机序列和过程的极值及其相关性质。纽约州施普林格·Zbl 0518.60021号
[14] Madeira,S.C.和Oliveira,A.L.(2004)。生物数据分析的双聚类算法:综述。IEEE/ACM传输。计算。生物。生物信息。1 24–45。
[15] Montanari,A.(2015)。在稀疏图中查找一个社区。《联邦统计物理杂志》161 273–299·Zbl 1327.82091号 ·doi:10.1007/s10955-015-1338-2
[16] Rahman,M.和Virág,B.(2014)。独立集的局部算法是半最优的。预打印。可从arXiv:1402.0485获取。
[17] Shabalin,A.A.、Weigman,V.J.、Perou,C.M.和Nobel,A.B.(2009年)。在高维数据中发现较大的平均子矩阵。附录申请。统计数字985–1012·Zbl 1196.62087号 ·doi:10.1214/09-AOAS239
[18] Sun,X.和Nobel,A.B.(2013)。关于高斯随机矩阵中大平均和ANOVA-fit子矩阵的最大尺寸。Bernoulli19 275-294·Zbl 1259.62062号 ·文件编号:10.3150/11-BEJ394
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。