×

利用贪婪算法和信息论准则选择预测因子。 (英语) Zbl 1521.62159号

摘要:我们讨论了以下贪婪算法在多变量时间序列预测中的应用:匹配寻踪算法(MPA)、正交匹配寻踪(OMP)、松弛匹配寻踪(RMP)、弗兰克·沃尔夫算法(FWA)和约束匹配寻踪(CMP)。最后两个是已知的套索问题的解算器。一些算法是众所周知的(例如OMP),而其他算法则不太流行(例如RMP)。我们提供了所有算法的统一表示,并评估了它们在高维情况和大数据情况下的计算复杂性。我们展示了如何将12个信息论(IT)标准与贪婪算法结合使用。作为这项工作的一部分,我们得出了新的理论结果,允许修改IT标准,以便与RMP兼容。预测能力在两个数据集的实验中进行了测试。第一个涉及在新西兰奥克兰测量的空气污染数据,第二个涉及英国的房价指数。
{©2023作者。澳大利亚和新西兰统计杂志由John Wiley&Sons Australia,Ltd代表澳大利亚统计学会出版。}

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62B10型 信息理论主题的统计方面
62平方米 随机过程推断和预测
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.(1974年)。统计模型识别的新视角。IEEE自动控制汇刊,AC‐19,716-723·Zbl 0314.62039号
[2] Barron,A.、Cohen,A.、Dahmen,W.和DeVore,R.(2008)。贪婪算法的近似和学习。《统计年鉴》,36,64-94·Zbl 1138.62019号
[3] Bijral,A.(2019年)。关于时间序列模型中稳定预测因子的选择。预打印ArXiv:1905.07659[stat.ME]。
[4] Bühlmann,P.&Hothorn,T.(2007)。助推算法:正则化、预测和模型拟合。统计科学,22477-505·Zbl 1246.62163号
[5] Bühlmann,P.&van deGeer,S.(2011)。高维数据统计。方法、理论和应用。柏林:Springer‐Verlag·Zbl 1273.62015年
[6] Bühlmann,P.&Yu,B.(2003)。L2损失促进:回归和分类。美国统计协会杂志,98,324-339·兹比尔1041.62029
[7] Carvalho,C.、Polson,N.和Scott,J.(2010年)。稀疏信号的马蹄形估计器。《生物特征》,97,465-480·Zbl 1406.62021号
[8] Cavanaugh,J.(1999)。基于Kullback对称发散的大样本模型选择准则。统计与概率快报,42,333-343·兹比尔0955.62012
[9] Chen,J.和Chen,Z.(2008)。大模型空间模型的扩展贝叶斯信息准则。生物特征,95759-771·Zbl 1437.62415号
[10] Ding,J.、Tarokh,V.和Yang,Y.(2018年)。模型选择技术:概述。IEEE信号处理杂志,35,16-34。
[11] Emerson,J.和Hoaglin,D.(1983年)。按中位数分析双向表。《理解稳健和探索性数据分析》,编辑,Hoaglin,D.(编辑),Mosteller,F.(编辑)和Tukey,J.(编辑。纽约:约翰·威利父子公司。
[12] Foygel,R.&Drton,M.(2010年)。高斯图形模型的扩展贝叶斯信息准则。《神经信息处理系统进展》第23版,Lafferty,J.(编辑)、Williams,C.(编辑),Shawe‐Taylor,J。
[13] Frandi,E.、Ni anculef,R.、Lodi,S.、Sartori,C.和Suykens,J.(2016)。通过具有收敛保证的随机Frank-Wolfe方法实现快速可扩展的Lasso。机器学习,104,195-221·Zbl 1386.68130号
[14] Frank,M.&Wolfe,P.(1956年)。二次规划的一种算法。《海军研究后勤季刊》,195-110。
[15] Freund,R.、Grigas,P.和Mazumder,R.(2017)。通过次梯度优化和相关函数对线性回归进行增强的新观点。《统计年鉴》,452328-2364·Zbl 1421.62086号
[16] Hansen,M.和Yu,B.(2001年)。模型选择和最小描述长度原则。美国统计协会杂志,96,746-774·Zbl 1017.62004号
[17] Hastie,T.、Tibshirani,R.和Friedman,J.(2008)。统计学习的要素。数据挖掘、推理和预测,第二版。纽约:Springer Science+Business Media。
[18] Hurvich,C.、Simonoff,J.和Tsai,C.L.(1998年)。使用改进的Akaike信息准则平滑非参数回归中的参数选择。英国皇家统计学会杂志:B辑,60,271-293·Zbl 0909.62039号
[19] 李凤(2020)。使用贪婪算法和信息论标准的高维统计建模中的预测(博士论文)。奥克兰:奥克兰大学。可从以下URL获得:http://hdl.handle.net/2292/51798
[20] Li,F.、Triggs,C.、Dumitrescu,B.和Giurcneanu,C.(2017)。关于匹配追踪算法的迭代次数。程序。第25届欧洲信号处理会议(Eusipco 2017)。希腊科斯,第181-185页。
[21] Li,F.,Triggs,C.,Dumitrescu,B.&Giurcneanu,C.(2019年)。重新审视匹配追求:大数据和新停止规则的变体。信号处理,155170-181。
[22] Lutkepöhl,H.(2005)。多时间序列分析新导论。柏林-海德堡纽约:施普林格·Zbl 1072.62075号
[23] Makalic,E.&Schmidt,D.(2016)。使用BayesReg包进行高维Bayes正则回归。预印ArXiv:1611.06649[stat.CO]。
[24] Mallat,S.和Zhang,(1993)。用时间频率字典匹配追踪。IEEE信号处理汇刊,41,3397-3415·兹比尔0842.94004
[25] Meinshausen,N.&Bühlmann,P.(2010年)。稳定性选择(讨论)。英国皇家统计学会杂志,B辑,72417-473·Zbl 1411.62142号
[26] Owrang,A.和Jansson,M.(2018年)。高维线性回归的模型选择标准。IEEE信号处理汇刊,66,3436-3446·Zbl 1414.62310号
[27] Park,T.&Casella,G.(2008)。贝叶斯套索。美国统计协会杂志,103,681-686·Zbl 1330.62292号
[28] Pati,Y.、Rezaiifar,R.和Krishnaprasad,P.(1993年)。正交匹配追踪:递归函数逼近及其在小波分解中的应用。第27届Asilomar信号、系统和计算机会议记录,第1卷,第40-44页。
[29] Rissanen,J.(1978年)。通过最短数据描述建模。Automatica,第14页,第465-471页·Zbl 0418.93079号
[30] Rissanen,J.(2007年)。统计建模中的信息和复杂性。纽约:Springer Science+Business Media·Zbl 1156.62005年
[31] Roos,T.、Myllymäki,P.和Rissanen,J.(2009)。重温MDL去噪。IEEE信号处理汇刊,57,3347-3360·Zbl 1391.94097号
[32] Sancetta,A.(2016)。贪婪的预测算法。伯努利,221227-1277·Zbl 1388.62209号
[33] Schmidt,D.和Makalic,E.(2009年)。MML不变线性回归。《第二十二届澳大利亚人工智能联合会议记录》,第312-321页。
[34] Schwarz,G.(1978年)。估算模型的维度。《统计年鉴》,第6461-464页·Zbl 0379.62005年
[35] Seghouane,A.K.和Bekara,M.(2004)。基于Kullback对称发散的小样本模型选择准则。IEEE信号处理汇刊,52,3314-3323·Zbl 1373.62035号
[36] Shah,R.和Samworth,R.(2013年)。误差控制变量选择:稳定性选择的另一个视角。英国皇家统计学会杂志,B辑,75,55-80·Zbl 07555438号
[37] 新西兰统计局(2013a)。2013年德文波特-塔卡普纳地方董事会区域人口普查快速统计。技术报告。可从以下URL获得:http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx?request_value=13613&parent_id=13170&tabname=&sc_device=pdf
[38] 新西兰统计局(2013b)。2013年人口普查——芙蓉和海湾当地董事会区域快速统计。技术报告。可从以下URL获得:http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx?request_value=13610&parent_id=13170&tabname=&sc_device=pdf
[39] 新西兰统计局(2013年c)。2013年人口普查关于Patumahoe的快速统计。技术报告。可从以下URL获得:http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx?request_value=13452&tabname=工作&sc_device=pdf
[40] 新西兰统计局(2013年d)。2013年人口普查-彭罗斯快速统计。技术报告。可从以下URL获得:http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx?request_value=13427&parent_id=13171&tabname=&sc_device=pdf
[41] Sturm,B.和Christensen,M.(2012年)。正交匹配追踪实现的比较。第20届欧洲信号处理会议记录(EUSIPCO),第220-224页。
[42] Tibshirani,R.(1996年)。通过Lasso进行回归分析和选择。英国皇家统计学会杂志,B辑,58267-288·Zbl 0850.62538号
[43] Tibshirani,R.J.和Taylor,J.(2012)。拉索问题的自由度。《统计年鉴》,第40期,第1198-1232页·Zbl 1274.62469号
[44] Turlach,B.(2005)。关于在条件下求解最小二乘问题的算法
[({\ell}_1\]\)罚款或
[({\ell}_1\]\)约束。《美国统计协会会刊》,统计计算部分,第2572-2577页。
[45] Wallace,C.(2005)。通过最小消息长度进行统计推断和归纳推断。纽约:Springer Science+Business Media·Zbl 1085.6202号
[46] Wong,C.、Makalic,E.和Schmidt,D.(2018年)。使用重尾先验分布的泊松和几何模型的最小消息长度推断。《数学心理学杂志》,83,1-11·Zbl 1404.62010年
[47] Yang,Y.(2016)。空气污染物PM_2.5浓度的预测模型(硕士论文)。奥克兰:奥克兰大学。可从以下URL获得:http://hdl.handle.net/2292/29431
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。