×

稀疏组融合Lasso进行模型分割:一种混合方法。 (英语) Zbl 07433033号

摘要:本文介绍了稀疏群融合套索(SGFL)作为一种统计框架,用于分割具有多元时间序列的稀疏回归模型。为了计算SGFL(一个非光滑且不可分离的凸规划)的解,我们开发了一种混合优化方法,该方法速度快,不需要调整参数选择,并且保证收敛到全局极小值。在数值实验中,混合方法在计算时间和数值精度方面优于最新技术;好处在高维度上尤其显著。该方法在恢复非零回归系数方面具有令人满意的统计性能,在变化点检测方面也具有良好的性能。介绍了空气质量数据的应用。混合方法在R包中实现稀疏GFL可在作者的Github页面上找到。

MSC公司:

37M10个 动力系统的时间序列分析
62J05型 线性回归;混合模型
62J07型 岭回归;收缩估计器(拉索)
65K10码 数值优化和变分技术
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alaíz,CM;Jiménez,甲B;Dorronsoro,JR,小组融合套索,Artif Neural Netw Mach Learn,2013,66-73(2013)
[2] Alewijnse,SPA公司;Buchin,K。;布钦,M。;Sijben,S。;Westenberg,MA,基于模型的轨迹分割和分类,Algorithmica,80,8,2422-2452(2018)·Zbl 1392.68423号 ·doi:10.1007/s00453-017-0329-x
[3] Bai,J.,《一次估计多个断裂》,《经济理论》,第13、3、315-352页(1997年)·网址:10.1017/S0266466600005831
[4] Bai,J。;Perron,P.,多种结构变化模型的计算和分析,应用经济学杂志,18,1,1-22(2003)·doi:10.1002/jae.659
[5] Barbero A,Sra S(2011)总变差正则化的快速牛顿型方法。摘自:第28届机器学习国际会议论文集,ICML 2011,第313-320页
[6] 马萨诸塞州巴斯维尔。;Nikiforov,IV,《突变检测:理论与应用》。普伦蒂斯·霍尔信息与系统科学系列(1993),恩格伍德悬崖:普伦蒂斯霍尔公司,恩格尔伍德悬崖·Zbl 1407.62012年
[7] 贝克,A。;Teboulle,M.,线性反问题的快速迭代收缩阈值算法,SIAM成像科学杂志,2,1,183-202(2009)·Zbl 1175.94009号 ·doi:10.1137/080716542
[8] 贝克尔,S。;Bobin,J。;Candès,EJ,NESTA:稀疏恢复的快速准确一阶方法,SIAM J Imaging Sci,4,1,1-39(2011)·Zbl 1209.90265号 ·数字对象标识代码:10.1137/090756855
[9] 啤酒,JC;艾岑斯坦,HJ;安德森,SJ;Krafty,RT,融合先验信息与融合稀疏群套索:应用于预测神经图像的临床测量,生物统计学,75,4,1299-1309(2019)·Zbl 1448.62151号 ·doi:10.1111/biom.13075
[10] Bertsekas,DP,凸集优化算法(2015),贝尔蒙特:雅典娜科学公司,贝尔蒙·Zbl 1347.90001号
[11] Bleakley K,Vert JP(2011)该团队融合套索用于多个变化点检测。技术报告hal-00602121。https://hal.archives-ouvertes.fr/hal-00602121。2020年10月15日访问
[12] 博伊德,S。;北卡罗来纳州帕里赫。;朱,E。;佩莱托,B。;Eckstein,J.,《通过交替方向乘数法进行分布式优化和统计学习》,《发现趋势——马赫学习》,3,1,1-122(2011)·Zbl 1229.90122号 ·doi:10.1561/220000016
[13] Bredies,K。;Lorenz,DA,迭代软阈值的线性收敛,傅里叶分析应用杂志,14,5-6,813-837(2008)·Zbl 1175.65061号 ·doi:10.1007/s00041-008-9041-1
[14] 曹,P。;刘,X。;刘,H。;杨,J。;赵,D。;Huang先生。;Zaiane,O.,广义融合组套索正则化多任务特征学习预测阿尔茨海默病认知结果,生物识别计算方法程序,162,19-45(2018)·doi:10.1016/j.cmpb.2018.04.028
[15] 陈,J。;Chen,Z.,《大模型空间模型选择的扩展贝叶斯信息准则》,Biometrika,95,3,759-771(2008)·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[16] 陈,X。;林,Q。;Kim,S。;卡博内尔,JG;Xing,EP,一般结构稀疏回归的平滑近端梯度法,Ann Appl Stat,6,2,719-752(2012)·兹比尔1243.62100 ·doi:10.1214/11-AOAS514
[17] Chi,EC;Lange,K.,凸聚类的分裂方法,J Comput Graph Stat,24,4,994-1013(2015)·doi:10.1080/10618602014.948181
[18] 组合框,PL;Pesquet,JC,科学与工程逆问题的定点算法,第章,信号处理中的近端分裂方法,185-212(2011),纽约:Springer,纽约·Zbl 1242.90160号
[19] Condat,L.,涉及Lipschitz、可逼近和线性组合项的凸优化的一种原对偶分裂方法,《最优化理论应用杂志》,158,2,460-479(2013)·Zbl 1272.90110号 ·doi:10.1007/s10957-012-0245-9
[20] De Vito,S。;Massera,E。;Piga,M。;Martinotto,L。;Di Francia,G.,《城市污染监测场景中用于苯估算的电子鼻现场校准》,Sens Actuator B Chem,129,2,750-757(2008)·doi:10.1016/j.snb.2007.09.060
[21] 德维托,S。;皮加,M。;Martinotto,L。;Di Francia,G.,(Co,No_2)和(No_x)城市污染监测,通过自动贝叶斯正则化现场校准电子鼻,Sens Actuator B Chem,143,1,182-191(2009)·doi:10.1016/j.snb.2009.08.041
[22] 弗里德曼,J。;哈斯蒂,T。;Höfling,H。;Tibshirani,R.,Pathwise坐标优化,Ann Appl Stat,1,2,302-332(2007)·Zbl 1378.90064号 ·doi:10.1214/07-AOAS131
[23] Fryzlewicz,P.,《用于多变化点检测的野生二进制分割》,《Ann Stat》,第42、6、2243页(2014年)·Zbl 1302.62075号 ·doi:10.1214/14-AOS1245
[24] Hadj-Selem,F。;Löfstedt,T。;Dohmatob,E。;弗劳因,V。;杜布瓦,M。;吉列莫特,V。;Duchesnay,E.,高维神经成像中结构稀疏回归Nesterov平滑的延续,IEEE Trans-Med Imaging,37,11,2403-2413(2018)·doi:10.1109/TMI.2018.2829802
[25] 哈拉克·D。;Nystrup,P。;Boyd,S.,多元时间序列的贪婪高斯分割,高级数据分析分类,13,3,727-751(2019)·Zbl 1459.62170号 ·doi:10.1007/s11634-018-0335-0
[26] Hocking T,Vert JP,Bach FR,Joulin A(2011)Clusterpath:一种使用凸融合惩罚的聚类算法。输入:ICML
[27] Hoefling,H.,融合套索信号逼近器的路径算法,J Comput Graph Stat,19,4984-1006(2010)·doi:10.1198/jcgs.2010.09208
[28] Kim,S。;Xing,EP,《结构稀疏性多响应回归的树引导群套索及其在eQTL映射中的应用》,《Ann Appl Stat》,6,3,1095-1117(2012)·Zbl 1254.62112号 ·doi:10.1214/12-AOAS549
[29] Kuhn,HW,关于费马问题的注释,Mat程序,4,98-107(1973)·Zbl 0255.90063号 ·doi:10.1007/BF01584648
[30] Leonardi F,Bühlmann P(2016)高维回归的计算效率变化点检测
[31] 李毅。;Osher,S.,应用于压缩传感的最小化的坐标下降优化;贪婪算法,逆Probl成像,3,3,487-503(2009)·Zbl 1188.90196号 ·doi:10.3934/ipi.2009.3.487
[32] 李,X。;莫,L。;袁,X。;Zhang,J.,稀疏群和融合LASSO模型的乘法器的线性交替方向方法,Comput Stati Data Anal,79203-221(2014)·Zbl 1506.62112号 ·doi:10.1016/j.csda.2014.05.017
[33] Liu J,Yuan L,Ye J(2010)一类融合套索问题的有效算法。摘自:第16届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’10。ACM,第323-332页
[34] Nesterov,Y.,非光滑函数的平滑最小化,数学程序,103,1,127-152(2005)·Zbl 1079.90102号 ·doi:10.1007/s10107-004-0552-5
[35] Nesterov,Y.,坐标下降法在大规模优化问题上的效率,SIAM J Optim,22,2,341-362(2012)·Zbl 1257.90073号 ·数字对象标识代码:10.1137/100802001
[36] Nystrup,P。;Madsen,H。;Lindström,E.,金融时间序列的长记忆和时变参数的隐马尔可夫模型,J Forecast,36,8,989-1002(2017)·Zbl 1397.60104号 ·doi:10.1002/用于2447
[37] Ohlsson,H。;Ljung,L。;Boyd,S.,使用形式和正则化分割ARX模型,Automatica,46,6,1107-1111(2010)·Zbl 1191.93139号 ·doi:10.1016/j.automatica.2010.03.013
[38] Ombao,H。;冯·萨克斯,R。;郭伟,多元非平稳时间序列的Slex分析,美国统计协会,100470519-531(2005)·Zbl 1117.62407号 ·doi:10.1198/0162145000001448
[39] 价格,BS;CJ Geyer;Rothman,AJ,《多项式逻辑回归中的自动响应类别组合》,《计算图形统计杂志》,第28、3、758-766页(2019年)·Zbl 07499092号 ·doi:10.1080/10618600.2019.1585258
[40] R核心团队(2019)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/。访问日期:2020年10月15日
[41] Ranalli,M。;拉戈纳,F。;皮科内,M。;Zambianchi,E.,《利用圆柱形隐马尔可夫模型分割海流场:复合似然法》,J R Stat Soc Ser C(Appl Stat),67,3,575-598(2018)·doi:10.1111/rssc.12240
[42] Rockafellar,R.,凸分析。普林斯顿数学和物理里程碑(2015),普林斯顿:普林斯顿大学出版社,普林斯顿
[43] 桑德森,C。;Curtin,R.,Armadillo:一个基于模板的线性代数C++库,J Open Source Softw,1,26(2016)·doi:10.21105/joss.00026
[44] 萨克森,JE;萨克森·H·。;Toivonen,HT,使用自组织模型识别开关线性系统并应用于铁水硅预测,应用软件计算,47,271-280(2016)·doi:10.1016/j.soc.2016.05.048
[45] Shor NZ(1985)《不可微函数的最小化方法》,计算数学中的Springer级数,第3卷。柏林施普林格(K.C.Kiwiel和A.Ruszczynski译自俄语)·Zbl 0561.90058号
[46] Songsiri J(2015)通过群融合套索学习多granger图形模型。致:2015年第十届亚洲控制会议(ASCC),第1-6页
[47] Tibshirani,R。;Wang,P.,使用融合套索对CGH数据进行空间平滑和热点检测,生物统计学,9,1,18-29(2007)·Zbl 1274.62886号 ·doi:10.1093/biostatistics/kxm013
[48] Tibshirani,R。;Bien,J。;弗里德曼,J。;哈斯蒂,T。;西蒙,N。;泰勒,J。;Tibshirani,RJ,套索型问题中丢弃预测因子的强规则,J R Stat Soc Ser B Stat Methodol,74,2,245-266(2012)·Zbl 1411.62213号 ·文件编号:10.1111/j.1467-9868.2011.01004.x
[49] Truong C、Oudre L、Vayatis N(2018)《变化点检测方法综述》。arXiv:1801.00718·Zbl 07160286号
[50] Tseng,P.,不可微极小化的块坐标下降法的收敛性,最优化理论应用杂志,109,3475-494(2001)·Zbl 1006.65062号 ·doi:10.1023/A:1017501703105
[51] Vũ,BC,单调算子前向-后向算法的可变度量扩展,数值函数分析优化,34,9,1050-1065(2013)·Zbl 1279.47075号 ·doi:10.1080/01630563.2013.763825
[52] Wang,T。;Zhu,L.,高维稀疏线性回归中的一致调整参数选择,J Multivar Anal,102,7,1141-1151(2011)·Zbl 1216.62103号 ·doi:10.1016/j.jmva.2011.03.007
[53] Wang,J。;风扇,W。;Ye,J.,通过次微分的单调性融合套索筛选规则,IEEE Trans-Pattern Ana Mach Intell,37,9,1806-1820(2015)·doi:10.1109/TPAMI.2014.2388203
[54] Wang,J。;旺卡,P。;Ye,J.,通过双多面体投影的拉索筛选规则,J Mach Learn Res,16,1063-1101(2015)·Zbl 1360.62403号
[55] 王,B。;Zhang,Y。;太阳,WW;Fang,Y.,稀疏凸聚类,J Comput Graph Stat,27,2,393-403(2018)·Zbl 07498956号 ·doi:10.1080/10618600.2017.1377081
[56] 魏斯菲尔德,E。;Plastria,F.,《关于到n个给定点的距离之和最小的点》,Ann Oper Res,167,1,7-41(2009)·Zbl 1176.90616号 ·doi:10.1007/s10479-008-0352-z
[57] Wytock,M。;Sra,S。;Kolter,JZ,群融合套索的快速牛顿方法,不确定Artif Intell,2014,888-897(2014)
[58] Xu,Y。;Lindquist,M.,动态连接性检测:一种确定功能性核磁共振成像数据中功能连接性变化点的算法,Front eurosci,92285(2015)
[59] Yan,M.,用线性算子最小化三个函数之和的一种新的原对偶算法,J Sci-Comput,76,31698-717(2018)·Zbl 1415.65142号 ·doi:10.1007/s10915-018-0680-3
[60] Yao,YC,通过Schwarz标准估计变化点的数量,Stat Probab Lett,6,3,181-189(1988)·Zbl 0642.62016号 ·doi:10.1016/0167-7152(88)90118-6
[61] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J R Stat Soc Ser B Stat Methodol,68,1,49-67(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[62] 周,J。;刘杰。;弗吉尼亚州纳拉扬;Ye,J.,通过多任务学习建模疾病进展,NeuroImage,78,233-248(2013)·doi:10.1016/j.neuroimage.2013.03.073
[63] Zhu C,Xu H,Leng C,Yan S(2014)《聚类的凸优化程序:理论回顾》。输入:NIPS
[64] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J R Stat Soc Ser B Stat Methodol,67,2,301-320(2005)·Zbl 1069.62054号 ·文件编号:10.1111/j.1467-9868.2005.005.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。