×

近似\(\ell_0\)-对图上分段恒定信号的估计进行惩罚。 (英文) Zbl 1456.62052号

设(G=(V,E)是一个已知的具有顶点(V)和边集(E)的无向图。在每个顶点\(i)处,观察到一个未知的信号值\(\mu_{0,i}\),带有噪声,导致\(Y_i=\mu_}0,i{+\epsilon_i\),\(\epsilen_i\,)为iid正态\(N(0,\sigma^{2})\)。主要问题是,当(mu{0})是(可以很好地近似于)(G)上的分段常数信号时,从观测数据估计真实信号向量(mu{0})。
重点是(l_0)边去噪,它寻求通过R_n中的值(mu)来估计(mu_{0}),以最小化剩余平方误差加上每条边的惩罚。该问题的组合性质使得目标的精确最小化在一般图的计算上很难实现。然而,主要目的是表明近似最小化足以获得统计上的速率最优保证。
主要结果如下。
一种多项式时间算法,可产生所考虑问题的近似极小值,该极小值可达到与精确极小值相同的统计风险,直至常数因子。
证明了对于任何图(G)建议的估计(hat mu{0}),一个“边稀疏”预言不等式,得到的风险界在边稀疏信号类上是极大极小意义下的速率最优的,直到乘数因子取决于(G)的平均顶点度。
给出了一种替代极小化对应的(l_1)/total-variation松弛的性质。
将先前的结果推广到非均匀图的边加权。
仿真和模拟应用说明了所选择的方法。所有证明均延迟至互联网上可用的附录中。

MSC公司:

62G05型 非参数估计
62G10型 非参数假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Addario-Berry,L.、Broutin,N.、Devroye,L.和Lugosi,G.(2010年)。关于组合测试问题。统计年鉴38 3063–3092·Zbl 1200.62059号 ·doi:10.1214/10-AOS817
[2] Arias-Castro,E.、Candès,E.J.和Durand,A.(2011年)。《网络中异常簇的检测》,《统计年鉴》39 278–304·Zbl 1209.62097号 ·doi:10.1214/10-AOS839
[3] Arias-Castro,E.、Candès,E.J.、Helgason,H.和Zeitouni,O.(2008)。在迷宫中寻找证据线索。《统计年鉴》36 1726–1757·Zbl 1143.62006年 ·doi:10.1214/07-AOS526
[4] Arias-Castro,E.、Donoho,D.L.和Huo,X.(2005)。基于快速多尺度方法的几何目标近最优检测。IEEE传输。通知。理论51 2402–2425·Zbl 1282.94014号 ·doi:10.1109/TIT.2005.850056
[5] Arias-Castro,E.和Grimmet,G.R.(2013)。使用渗流的网络聚类检测。伯努利19 676–719·Zbl 1457.62177号 ·doi:10.3150/11-BEJ412
[6] Auger,I.E.和Lawrence,C.E.(1989)。分段邻域的最优识别算法。牛市。数学。生物51 39–54·Zbl 0658.92010号 ·doi:10.1007/BF02458835
[7] Barron,A.、Birgé,L.和Massart,P.(1999)。通过惩罚选择模型的风险边界。普罗巴伯。理论相关领域113 301–413·Zbl 0946.62036号 ·doi:10.1007/s004400050210
[8] Barry,D.和Hartigan,J.A.(1993年)。变点问题的贝叶斯分析。J.Amer。统计师。协会88 309–319·Zbl 0775.62065号
[9] Besag,J.(1986年)。关于脏图片的统计分析。J.罗伊。统计师。Soc.序列号。B48 259-302·Zbl 0609.62150号
[10] Bickel,P.J.、Ritov,Y.和Tsybakov,A.B.(2009年)。Lasso和Dantzig选择器的同时分析。统计年鉴37 1705–1732·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[11] Birgé,L.和Massart,P.(2007年)。高斯模型选择的最小惩罚。普罗巴伯。理论相关领域138 33–73·Zbl 1112.62082号 ·doi:10.1007/s00440-006-0011-8
[12] Boykov,Y.和Kolmogorov,V.(2004)。视觉能量最小化的最小/最大流算法的实验比较。IEEE传输。模式分析。机器。情报26 1124–1137·Zbl 1005.68964号
[13] Boykov,Y.、Veksler,O.和Zabih,R.(2001)。通过图形切割实现快速近似能量最小化。IEEE传输。模式分析。机器。情报23 1222–1239。
[14] Boysen,L.、Kempe,A.、Liebscher,V.、Munk,A.和Wittich,O.(2009年)。跳跃型最小二乘估计量的一致性和收敛速度。《统计年鉴》37 157–183·Zbl 1155.62034号 ·doi:10.1214/07-AOS558
[15] Chambolle,A.(2005年)。总变差最小化和一类二元MRF模型。在EMMCVPR 2005 136–152中。柏林施普林格。
[16] Chambolle,A.和Lions,P.-L.(1997)。通过总变差最小化和相关问题进行图像恢复。数字。数学76 167–188·Zbl 0874.68299号 ·doi:10.1007/s002110050258
[17] Chen,S.S.、Donoho,D.L.和Saunders,M.A.(2001)。通过基追踪进行原子分解。SIAM版本43 129–159·Zbl 0979.94010号 ·doi:10.1137/S003614450037906X
[18] Chernoff,H.和Zacks,S.(1964年)。估计受时间变化影响的正态分布的当前平均值。安。数学。统计数字35 999–1018·Zbl 0218.62033号 ·doi:10.1214/aoms/1177700517
[19] Dalalyan,A.S.、Hebiri,M.和Lederer,J.(2017年)。关于拉索的预测性能。伯努利23 552–581·Zbl 1359.62295号 ·doi:10.3150/15-BEJ756
[20] Darbon,J.和Sigelle,M.(2005年)。一种快速准确的总偏差最小化算法。在伊比利亚模式识别和图像分析会议351-359。柏林施普林格。
[21] Davies,P.L.和Kovac,A.(2001)。局部极值、运行、字符串和多分辨率。统计年鉴29 1-65·Zbl 1029.62038号 ·doi:10.1214/aos/996986501
[22] Donoho,D.L.(1999)。楔形体:边缘的近似极小极大估计。统计年鉴27 859–897·Zbl 0957.62029号 ·doi:10.1214/aos/1018031261
[23] Donoho,D.L.和Johnstone,I.M.(1994年)。通过小波收缩实现理想的空间自适应。生物特征81 425–455·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[24] Efron,B.(2004)。大规模同时假设检验:选择一个无效假设。J.Amer。统计师。协会99 96–104·Zbl 1089.62502号 ·doi:10.1198/0162145000000089
[25] Fan,Z.和Guan,L.(2018)。对“近似值”的补充\(ℓ_{0}\)-图上分段常数信号的惩罚估计。”DOI:10.1214/17-AOS1656支持。
[26] Geman,S.和Geman,D.(1984年)。随机松弛、吉布斯分布和图像的贝叶斯恢复。IEEE传输。模式分析。机器。情报6 721–741·Zbl 0573.62030号 ·doi:10.1109/TPAMI.1984.4767596
[27] Ghosh,A.、Boyd,S.和Saberi,A.(2008)。最小化图形的有效阻力。SIAM版次50 37–66·Zbl 1134.05057号 ·doi:10.1137/050645452
[28] Goldstein,T.和Osher,S.(2009年)。L1正则化问题的分裂Bregman方法。SIAM J.成像科学2 323–343·Zbl 1177.65088号 ·doi:10.1137/080725891
[29] Greig,D.M.、Porteous,B.T.和Seheult,A.H.(1989)。二值图像的精确最大后验估计。J.R.统计社会服务。B.统计方法51 271–279。
[30] Guntuboyina,A.、Lieu,D.、Chatterjee,S.和Sen,B.(2017年)。趋势过滤中的空间适应。arXiv:1702.05113提供。
[31] Harchaoui,Z.和Lévy-Leduc,C.(2010年)。具有总变差惩罚的多个变点估计。J.Amer。统计师。协会105 1480–1493·Zbl 1388.62211号 ·doi:10.1198/jasa.2010.tm09181
[32] Harris,X.T.(2016)。模型搜索后的预测错误。可从arXiv:1610.06107获取。
[33] Hoefling,H.(2010年)。融合套索信号近似器的路径算法。J.计算。图表。统计.19 984–1006。在线提供补充材料。
[34] Hütter,J.-C.和Rigollet,P.(2016)。全变分去噪的最佳速率。在Conf.学习理论1115-1146中。
[35] Jackson,B.、Scargle,J.D.等人(2005年)。一种在区间上对数据进行优化分区的算法。IEEE信号处理。第12页105–108。
[36] Johnstone,I.(2015)。高斯估计:序列和小波模型。网址:statweb.stanford.edu/imj/GE09-08-15.pdf。
[37] Karger,D.R.和Stein,C.(1996年)。最小割问题的一种新方法。美国医学会标准43 601–640·Zbl 0882.68103号 ·数字对象标识代码:10.1145/234533.234534
[38] Killick,R.、Fearnhead,P.和Eckley,I.A.(2012年)。具有线性计算成本的最佳变化点检测。J.Amer。统计师。协会107 1590–1598·Zbl 1258.62091号 ·doi:10.1080/01621459.2012.737745
[39] Kolmogorov,V.和Zabin,R.(2004)。哪些能量函数可以通过图形切割最小化?IEEE传输。模式分析。机器。情报26 147–159。
[40] Korostelev,A.P.和Tsybakov,A.B.(1993)。图像重建的极小极大理论。统计学课堂讲稿82。纽约州施普林格·Zbl 0833.62039号
[41] Kovac,A.和Smith,A.D.(2011年)。图上的非参数回归。J.计算。图表。统计20 432–447。
[42] 埃利桑那州勒巴比尔。(2005年)。通过模型选择检测高斯过程均值中的多个变化点。信号处理85 717–736·Zbl 1148.94403号 ·doi:10.1016/j.sigpro.2004.11.012
[43] Lin,K.、Sharpnack,J.、Rinaldo,A.和Tibshirani,R.J.(2016)。变更点问题的近似恢复,来自\(ℓ_{2} 估计错误率。可从arXiv:1606.06746获取。
[44] Livne,O.E.和Brandt,A.(2012年)。精益代数多重网格(LAMG):快速图形拉普拉斯线性求解器。SIAM J.科学。计算34 B499–B522·Zbl 1253.65045号 ·数字对象标识代码:10.1137/10843563
[45] Lovász,L.(1996)。图上的随机行走:一项调查。《组合数学:保罗·埃尔德的八十》,第2卷(凯西利,1993)。Bolyai Soc.数学。螺柱2 353–397。János Bolyai数学。布达佩斯Soc·Zbl 0854.60071号
[46] Madrid Padilla,O.H.、Scott,J.G.、Sharpnack,J.和Tibshirani,R.J.(2016)。DFS融合套索:图和树的近似最优线性时间去噪。可从arXiv:1608.03384获取。
[47] Mammen,E.和van de Geer,S.(1997年)。局部自适应回归样条。《统计年鉴》25 387–413·Zbl 0871.62040号 ·doi:10.1214操作系统/1034276635
[48] Moore,C.和Newman,M.E.(2000年)。小世界网络中的流行病和渗透。物理学。版本E61 5678–5682。
[49] Mumford,D.和Shah,J.(1989年)。分段光滑函数和相关变分问题的最佳逼近。普通纯应用程序。数学42 577–685·Zbl 0691.49036号 ·doi:10.1002/cpa.3160420503
[50] Rinaldo,A.(2009年)。融合套索的特性和改进。统计年鉴37 2922–2952·Zbl 1173.62027号 ·doi:10.1214/08-AOS665
[51] Rudin,L.I.、Osher,S.和Fatemi,E.(1992年)。基于非线性全变分的噪声去除算法。物理学。D60 259–268。《实验数学:非线性科学中的计算问题》(Los Alamos,NM,1991)·Zbl 0780.49028号 ·doi:10.1016/0167-2789(92)90242-F
[52] Sadhanala,V.、Wang,Y.-X.和Tibshirani,R.(2016)。拉普拉斯平滑的图稀疏化方法。在国际会计准则中。智力。统计师。1250–1259.
[53] Sadhanala,V.、Wang,Y.-X.和Tibshirani,R.J.(2016)。1d以上的总变化等级:最小最大速率,以及线性平滑器的限制。高级神经信息。过程。系统。3513–3521.
[54] Sharpnack,J.、Rinaldo,A.和Singh,A.(2012年)。图上边缘套索的稀疏性。在国际会计准则中。智力。统计师。1028–1036.
[55] Sharpnack,J.、Singh,A.和Rinaldo,A.(2013)。使用生成树小波基检测图上的激活。在国际会计准则中。智力。统计师。545–553.
[56] Sharpnack,J.L.、Krishnamurthy,A.和Singh,A.(2013)。使用Lovasz扩展扫描统计的图中的近最优异常检测。高级神经信息。过程。系统。1959–1967.
[57] Spielman,D.A.和Srivastava,N.(2011年)。通过有效阻力进行图形稀疏。SIAM J.Comput.40 1913–1926年·Zbl 1237.05129号 ·doi:10.1137/080734029
[58] Spielman,D.A.和Teng,S.-H.(2004)。用于图划分、图稀疏化和求解线性系统的近线性时间算法。在ACM Symp。理论计算。81–90.纽约ACM·兹比尔1192.65048
[59] Tansey,W.和Scott,J.G.(2015)。一种快速灵活的图形套索算法。可从arXiv:1505.06475获取。
[60] Tian,X.和Taylor,J.E.(2015)。随机反应的选择性推理。可从arXiv:1507.06739获取·Zbl 1392.62144号 ·doi:10.1214/17-AOS1564
[61] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.R.统计社会服务。B.统计方法58 267–288·Zbl 0850.62538号
[62] Tibshirani,R.、Saunders,M.、Rosset,S.、Zhu,J.和K.奈特(2005)。通过融合套索实现轻盈流畅。J.R.统计社会服务。B.统计方法67 91–108·兹比尔1060.62049 ·文件编号:10.1111/j.1467-9868.2005.00490.x
[63] Tibshirani,R.J.和Taylor,J.(2011)。广义套索的解路径。《统计年鉴》39 1335–1371·Zbl 1234.62107号 ·doi:10.1214/11-AOS878
[64] van de Geer,S.A.和Bühlmann,P.(2009)。根据用于证明拉索预言结果的条件。电子。《美国联邦法律大全》第3卷第1360–1392页·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[65] Wang,Y.-X.、Sharpnack,J.、Smola,A.J.和Tibshirani,R.J.(2016)。对图形进行趋势筛选。J.马赫。学习。决议17第105号文件·Zbl 1369.62082号
[66] Winkler,G.和Liebscher,V.(2002年)。用于不连续信号的平滑器。J.非参数。统计数据14 203-222·Zbl 1019.62090号 ·doi:10.1080/10485250211388
[67] Xin,B.、Kawahara,Y.、Wang,Y.和Gao,W.(2014)。高效广义融合套索及其在阿尔茨海默病诊断中的应用。程序中。助理高级人工制品。智力。符合2163–2169。
[68] Yao,Y.C.(1984)。噪声离散时间步长函数的估计:贝叶斯和经验贝叶斯方法。《统计年鉴》12 1434–1447·Zbl 0551.62069号 ·doi:10.1214/aos/1176346802
[69] Yao,Y.C.(1988)。通过Schwarz标准估计转换点的数量。统计师。普罗巴伯。第6页181-189·Zbl 0642.62016号 ·doi:10.1016/0167-7152(88)90118-6
[70] Yao,Y.C.和Au,S.-T.(1989)。阶跃函数的最小二乘估计。SankhyáSer。A51 370–381·Zbl 0711.62031号
[71] Zhang,Y.,Wainwright,M.J.和Jordan,M.I.(2014)。稀疏线性回归多项式时间算法性能的下限。Conf.学习理论35 1–28。
[72] Zhang,Y.,Wainwright,M.J.和Jordan,M.I.(2017)。稀疏线性模型的最优预测?坐标可分M-估计量的下限。电子。J.Stat.11 752–799·Zbl 1362.62053号 ·doi:10.1214/17-EJS1233
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。