×

高斯随机矩阵中大平均子矩阵检测问题的能量景观。 (英语) Zbl 1371.60010号

摘要:在对从基因组学到社会科学等多个学科的数据进行探索性分析时,出现了寻找实值矩阵的大平均子矩阵的问题。在本文中,我们对(n次n)高斯随机矩阵的大平均子矩阵进行了详细的渐近分析。本文的第一部分讨论了全局极大值。对于固定的(k),我们确定了平均值最大的(k乘k)子矩阵的平均值和联合分布。作为对偶结果,我们确定平均值大于固定正常数的最大平方子矩阵的大小在很大概率下等于取决于阈值和矩阵维数的两个连续整数之一。论文的第二部分讨论了局部极大值。特别地,我们考虑具有主导行和列总和的子矩阵,它们是大型平均子矩阵迭代搜索过程的局部最优解。对于固定的(k),我们确定了条件为局部极大值的(k乘k)子矩阵的极限平均值和联合分布。为了理解这种局部极值点的密度并解释这种迭代过程的快速收敛性,我们从(L_n(k))的均值和波动行为的精确渐近表达式开始,分析了局部极大值的个数。对于固定的(k),(L_{n}(k))的平均值为(Theta(n^{k}/(log{n})^{(k-1)/2}),而标准偏差为(Theta[n^{2k^2/(k+1)}/(\log{n{)^{k^2/(k+1})}))。我们的主要结果是基于Stein方法的一个新变体的\(L_n(k)\)的高斯中心极限定理。

MSC公司:

60对20 随机矩阵(概率方面)
05C80号 随机图(图形理论方面)
60F05型 中心极限和其他弱定理
60G70型 极值理论;极值随机过程
60二氧化碳 组合概率
05C90年 图论的应用

软件:

LAS公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achlioptas,D.,Naor,A.:随机图的色数的两个可能值。安。数学。(2) 162(3), 1335-1351 (2005) ·Zbl 1094.05048号 ·doi:10.4007/annals.2005.162.1335
[2] Addario-Berry,L.、Broutin,N.、Devroye,L.和Lugosi,G.:关于组合测试问题。Ann.Statist公司。38(5), 3063-3092 (2010) ·Zbl 1200.62059号 ·doi:10.1214/10-AOS817
[3] Aidekon,E.:分支随机游动最小值定律的收敛性(2011)。arXiv预打印arXiv:1101.1810·Zbl 1285.60086号
[4] Aldous,D.J.,Bordenav,C.,Lelarge,M.:随机数据上的动态规划优化:近最优解的缩放指数。SIAM J.计算。38(6), 2382-2410 (2009) ·Zbl 1193.68123号 ·doi:10.1137/070709037
[5] Alon,N.,Krivelevich,M.,Sudakov,B.:在随机图中寻找一个隐藏的大集团。摘自:第九届ACM-SIAM离散算法年会论文集(加利福尼亚州旧金山),第594-598页(1998)·Zbl 0930.68109号
[6] Arias-Castro,E.,Candès,E.J.,Durand,A.:《网络中异常簇的检测》,《统计年鉴》。39(1), 278-304 (2011) ·Zbl 1209.62097号 ·doi:10.1214/10-AOS839
[7] Arias-Castro,E.,Candès,E.J.,Helgason,H.,Zeitouni,O.:在迷宫中寻找证据线索。Ann.Statist公司。36(4), 1726-1757 (2008) ·Zbl 1143.62006年 ·doi:10.1214/07-AOS526
[8] Balakrishnan,S.,Kolar,M.,Rinaldo,A.:使用压缩测量恢复块状结构激活(2012年)。arXiv预打印arXiv:1209.3431·Zbl 1366.62034号
[9] Baldi,P.,Rinott,Y.,Stein,C.:图上随机函数局部极大值个数的正常近似。收录于:概率、统计和数学,第59-81页。马萨诸塞州波士顿学术出版社(1989)·兹比尔0704.62018
[10] Berman,S.M.:平稳序列中最大项的极限定理。安。数学。《美国联邦法律大全》第35卷第502-516页(1964年)·兹伯利0122.13503 ·doi:10.1214/aoms/1177703551
[11] Bollobás,B.,Erdős,P.:随机图中的团。数学。程序。剑桥菲洛斯。Soc.80(3),419-427(1976)·Zbl 0344.05155号 ·doi:10.1017/S0305004100053056
[12] Bollobás,B.:随机图。剑桥高等数学研究,第73卷,第2版。剑桥大学出版社,剑桥(2001)。doi:10.1017/CBO9780511814068·Zbl 0979.05003号
[13] Butucea,C.,Ingster,Y.I.:检测高维噪声矩阵的稀疏子矩阵(2011)。arXiv预打印arXiv:1109.0898·Zbl 1457.62072号
[14] Chen,L.H.Y.,Goldstein,L.,Shao,Q.-M.:采用Stein方法的正态近似。概率及其应用。斯普林格,海德堡(2011)。数字对象标识代码:10.1007/978-3-642-15007-4·Zbl 0344.05155号
[15] Chen,L.H.Y.,Shao,Q.-M.:正态近似的Stein方法。收录:斯坦因方法简介。《讲义系列》,新加坡国立大学数学科学研究所,第4卷,第1-59页。新加坡大学出版社,新加坡(2005年)。doi:10.1142/9789812567680_0001·2007年6月10日
[16] Dekel,Y.,Gurel-Gurevich,O.,Peres,Y.:高概率线性时间内发现隐藏集团(2010)。arXiv预打印arXiv:1010.2997·Zbl 1290.05129号
[17] Diaconis,P.,Holmes,S.(编辑):Stein的方法:说明文讲座和应用,数学统计研究所讲稿-专著系列,46,俄亥俄州比奇伍德数学统计研究院,2004年。斯坦福大学斯坦因方法研讨会论文(1998年)·Zbl 1079.62024号
[18] Durrett,R.,Limic,V.:NK模型的严格结果。安·普罗巴伯。31(4), 1713-1753 (2003) ·Zbl 1049.60037号 ·doi:10.1214/aop/1068646364
[19] Evans,S.N.,Steinsaltz,D.:估算NK健身景观的一些特征。附录申请。普罗巴伯。12(4),1299-1321(2002)·Zbl 1040.60043号 ·doi:10.1214/aoap/1037125864
[20] Fortunato,S.:图形中的社区检测。物理学。代表486(3),75-174(2010)·doi:10.1016/j.physrep.2009.11.002
[21] Galambos,J.:关于随机变量最大值的分布。安。数学。《美国联邦法律大全》第43卷第516-521页(1972年)·Zbl 0238.62060 ·doi:10.1214/aoms/1177692632
[22] Gamarnik,D.,Sudan,M.:稀疏随机图上局部算法的极限。摘自:《第五届理论计算机科学创新会议论文集》,第369-376页(2014)·Zbl 1365.05277号
[23] Jerrum,M.:大集团避开了大都会进程。随机结构。算法3(4),347-359(1992)·Zbl 0754.60018号 ·doi:10.1002/rsa.3240030402
[24] Kauffman,S.A.、Weinberger,E.D.:崎岖健身环境的nk模型及其在免疫反应成熟中的应用。J.西奥。《生物学》141(2),211-245(1989)·doi:10.1016/S0022-5193(89)80019-0
[25] Leadbetter,M.R.,Lindgren,G.,Rootzén,H.:随机序列和过程的极值和相关性质。统计学中的斯普林格系列。纽约州施普林格市(1983年)·Zbl 0518.60021号
[26] Li,W.V.,Shao,Q.-M.:一个正态比较不等式及其应用。普罗巴伯。理论关联。字段122(4),494-508(2002)·兹比尔1004.60031 ·doi:10.1007/s004400100176
[27] Limic,V.,Pemantle,R.:考夫曼-列文进化模型的更严格结果。安·普罗巴伯。32(3A),2149-2178(2004)·Zbl 1044.92042号 ·doi:10.1214/009117904000000081
[28] Madeira,S.C.,Oliveira,A.L.:生物数据分析的双聚类算法:一项调查。IEEE/ACM传输。计算。生物信息。1(1), 24-45 (2004) ·doi:10.1109/TCBB.2004.2
[29] Mahoney,M.W.:矩阵和数据的随机算法(2011年)。arXiv预打印arXiv:1104.5557·Zbl 1232.68173号
[30] Mahoney,M.W.:大规模数据分析的算法和统计观点(2010年)。arXiv预打印arXiv:1010.1609·Zbl 0525.05052号
[31] Mézard,M.,Montanari,A.:信息、物理和计算。牛津大学毕业生文凭。牛津大学出版社,牛津(2009)。doi:10.1093/acprof:oso/9780198570837.001.0001·Zbl 1163.94001号
[32] Mézard,M.,Parisi,G.,Virasoro,M.A.:自旋玻璃理论及其后的发展。《世界科学物理讲义》,第9卷。世界科学出版公司,新泽西州Teaneck(1987)。国际标准图书编号9971-50-115-5、9971-50-116-3·Zbl 0992.82500号
[33] Pittel’,B.:关于求图的稳定数的一些算法的可能行为。数学。程序。剑桥菲洛斯。Soc.92(3),511-526(1982)·Zbl 0525.05052号 ·doi:10.1017/S0305004100060205
[34] Rahman,M.,Virag,B.:独立集的局部算法是半最优的(2014)。arXiv预打印arXiv:1402.0485·Zbl 1377.60049号
[35] Reidys,C.M.,Stadler,P.F.:组合景观。SIAM版本44(1),3-54(2002)·Zbl 0996.92026号 ·doi:10.1137/S0036144501395952
[36] 罗斯,N.:斯坦方法的基本原理。普罗巴伯。Surv公司。8, 210-293 (2011) ·Zbl 1245.60033号 ·doi:10.1214/11-PS182
[37] Shabalin,A.A.,Weigman,V.J.,Perou,C.M.,Nobel,A.B.:在高维数据中发现大平均子矩阵。附录申请。Stat.3(3),985-1012(2009)·Zbl 1196.62087号 ·doi:10.1214/09-AOAS239
[38] 斯蒂尔,J.M.:概率论与组合优化。收录于:CBMS-NSF应用数学区域会议系列,第69卷。费城工业和应用数学学会(SIAM)(1997年)·Zbl 0916.90233号
[39] Stein,C.:相依随机变量和分布的正态近似误差的界。摘自:第六届伯克利数理统计与概率研讨会论文集(加利福尼亚大学伯克利分校,1970/1971),第二卷:概率论,第583-602页(1972)·Zbl 0278.60026号
[40] Sun,X.,Nobel,A.B.:关于高斯随机矩阵中大平均和无方差子矩阵的最大尺寸(2010)。arxiv预打印arxiv:1009.0562·Zbl 1259.62062号
[41] Weinberger,E.D.:考夫曼Nk模型的局部特性:一个可调节的崎岖不平的能源景观。物理学。修订版A 44(10),6399(1991)·doi:10.1103/PhysRevA.44.6399
[42] Willink,R.:二元正态分布函数的界。Commun公司。统计理论方法33(10),2281-2297(2004)·兹比尔1217.60018 ·doi:10.1081/STA-200031505
[43] Wright,S.:突变、近亲繁殖、杂交和选择在进化中的作用。载:《第六届国际遗传学大会论文集》,第356-366页(1932年)·Zbl 1193.68123号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。