文件Zbl 1521.62159-zbMATH Open

李方耀;克里斯托弗·特里格斯（Christopher M.Triggs）。;朱尔卡内努、奇普里安·多鲁

利用贪婪算法和信息论准则选择预测因子。（英语） Zbl 1521.62159号

澳大利亚。N.Z.J.统计。 65，第2号，77-100（2023）.

摘要：我们讨论了以下贪婪算法在多变量时间序列预测中的应用：匹配寻踪算法（MPA）、正交匹配寻踪（OMP）、松弛匹配寻踪（RMP）、弗兰克·沃尔夫算法（FWA）和约束匹配寻踪（CMP）。最后两个是已知的套索问题的解算器。一些算法是众所周知的（例如OMP），而其他算法则不太流行（例如RMP）。我们提供了所有算法的统一表示，并评估了它们在高维情况和大数据情况下的计算复杂性。我们展示了如何将12个信息论（IT）标准与贪婪算法结合使用。作为这项工作的一部分，我们得出了新的理论结果，允许修改IT标准，以便与RMP兼容。预测能力在两个数据集的实验中进行了测试。第一个涉及在新西兰奥克兰测量的空气污染数据，第二个涉及英国的房价指数。
｛©2023作者。澳大利亚和新西兰统计杂志由John Wiley&Sons Australia，Ltd代表澳大利亚统计学会出版。}

MSC公司：

62M10个	统计学中的时间序列、自相关、回归等（GARCH）
62B10型	信息理论主题的统计方面
62平方米	随机过程推断和预测

关键词：

大数据;高维时间序列;真实数据

软件：

ElemStatLearn（电子状态学习）;贝叶斯注册

PDF格式 BibTeX公司 XML格式引用

全文：内政部

OA许可证

参考文献：

[1]	Akaike，H.（1974年）。统计模型识别的新视角。IEEE自动控制汇刊，AC‐19，716-723·Zbl 0314.62039号
[2]	Barron，A.、Cohen，A.、Dahmen，W.和DeVore，R.（2008）。贪婪算法的近似和学习。《统计年鉴》，36，64-94·Zbl 1138.62019号
[3]	Bijral，A.（2019年）。关于时间序列模型中稳定预测因子的选择。预打印ArXiv:1905.07659[stat.ME]。
[4]	Bühlmann，P.&Hothorn，T.（2007）。助推算法：正则化、预测和模型拟合。统计科学，22477-505·Zbl 1246.62163号
[5]	Bühlmann，P.&van deGeer，S.（2011）。高维数据统计。方法、理论和应用。柏林：Springer‐Verlag·Zbl 1273.62015年
[6]	Bühlmann，P.&Yu，B.（2003）。L2损失促进：回归和分类。美国统计协会杂志，98，324-339·兹比尔1041.62029
[7]	Carvalho，C.、Polson，N.和Scott，J.（2010年）。稀疏信号的马蹄形估计器。《生物特征》，97，465-480·Zbl 1406.62021号
[8]	Cavanaugh，J.（1999）。基于Kullback对称发散的大样本模型选择准则。统计与概率快报，42，333-343·兹比尔0955.62012
[9]	Chen，J.和Chen，Z.（2008）。大模型空间模型的扩展贝叶斯信息准则。生物特征，95759-771·Zbl 1437.62415号
[10]	Ding，J.、Tarokh，V.和Yang，Y.（2018年）。模型选择技术：概述。IEEE信号处理杂志，35，16-34。
[11]	Emerson，J.和Hoaglin，D.（1983年）。按中位数分析双向表。《理解稳健和探索性数据分析》，编辑，Hoaglin，D.（编辑），Mosteller，F.（编辑）和Tukey，J.（编辑。纽约：约翰·威利父子公司。
[12]	Foygel，R.&Drton，M.（2010年）。高斯图形模型的扩展贝叶斯信息准则。《神经信息处理系统进展》第23版，Lafferty，J.（编辑）、Williams，C.（编辑），Shawe‐Taylor，J。
[13]	Frandi，E.、Ni anculef，R.、Lodi，S.、Sartori，C.和Suykens，J.（2016）。通过具有收敛保证的随机Frank-Wolfe方法实现快速可扩展的Lasso。机器学习，104，195-221·Zbl 1386.68130号
[14]	Frank，M.&Wolfe，P.（1956年）。二次规划的一种算法。《海军研究后勤季刊》，195-110。
[15]	Freund，R.、Grigas，P.和Mazumder，R.（2017）。通过次梯度优化和相关函数对线性回归进行增强的新观点。《统计年鉴》，452328-2364·Zbl 1421.62086号
[16]	Hansen，M.和Yu，B.（2001年）。模型选择和最小描述长度原则。美国统计协会杂志，96，746-774·Zbl 1017.62004号
[17]	Hastie，T.、Tibshirani，R.和Friedman，J.（2008）。统计学习的要素。数据挖掘、推理和预测，第二版。纽约：Springer Science+Business Media。
[18]	Hurvich，C.、Simonoff，J.和Tsai，C.L.（1998年）。使用改进的Akaike信息准则平滑非参数回归中的参数选择。英国皇家统计学会杂志：B辑，60，271-293·Zbl 0909.62039号
[19]	李凤（2020）。使用贪婪算法和信息论标准的高维统计建模中的预测（博士论文）。奥克兰：奥克兰大学。可从以下URL获得：http://hdl.handle.net/2292/51798
[20]	Li，F.、Triggs，C.、Dumitrescu，B.和Giurcneanu，C.（2017）。关于匹配追踪算法的迭代次数。程序。第25届欧洲信号处理会议（Eusipco 2017）。希腊科斯，第181-185页。
[21]	Li，F.，Triggs，C.，Dumitrescu，B.&Giurcneanu，C.（2019年）。重新审视匹配追求：大数据和新停止规则的变体。信号处理，155170-181。
[22]	Lutkepöhl，H.（2005）。多时间序列分析新导论。柏林-海德堡纽约：施普林格·Zbl 1072.62075号
[23]	Makalic，E.&Schmidt，D.（2016）。使用BayesReg包进行高维Bayes正则回归。预印ArXiv:1611.06649[stat.CO]。
[24]	Mallat，S.和Zhang，（1993）。用时间频率字典匹配追踪。IEEE信号处理汇刊，41，3397-3415·兹比尔0842.94004
[25]	Meinshausen，N.＆Bühlmann，P.（2010年）。稳定性选择（讨论）。英国皇家统计学会杂志，B辑，72417-473·Zbl 1411.62142号
[26]	Owrang，A.和Jansson，M.（2018年）。高维线性回归的模型选择标准。IEEE信号处理汇刊，66，3436-3446·Zbl 1414.62310号
[27]	Park，T.&Casella，G.（2008）。贝叶斯套索。美国统计协会杂志，103，681-686·Zbl 1330.62292号
[28]	Pati，Y.、Rezaiifar，R.和Krishnaprasad，P.（1993年）。正交匹配追踪：递归函数逼近及其在小波分解中的应用。第27届Asilomar信号、系统和计算机会议记录，第1卷，第40-44页。
[29]	Rissanen，J.（1978年）。通过最短数据描述建模。Automatica，第14页，第465-471页·Zbl 0418.93079号
[30]	Rissanen，J.（2007年）。统计建模中的信息和复杂性。纽约：Springer Science+Business Media·Zbl 1156.62005年
[31]	Roos，T.、Myllymäki，P.和Rissanen，J.（2009）。重温MDL去噪。IEEE信号处理汇刊，57，3347-3360·Zbl 1391.94097号
[32]	Sancetta，A.（2016）。贪婪的预测算法。伯努利，221227-1277·Zbl 1388.62209号
[33]	Schmidt，D.和Makalic，E.（2009年）。MML不变线性回归。《第二十二届澳大利亚人工智能联合会议记录》，第312-321页。
[34]	Schwarz，G.（1978年）。估算模型的维度。《统计年鉴》，第6461-464页·Zbl 0379.62005年
[35]	Seghouane，A.K.和Bekara，M.（2004）。基于Kullback对称发散的小样本模型选择准则。IEEE信号处理汇刊，52，3314-3323·Zbl 1373.62035号
[36]	Shah，R.和Samworth，R.（2013年）。误差控制变量选择：稳定性选择的另一个视角。英国皇家统计学会杂志，B辑，75，55-80·Zbl 07555438号
[37]	新西兰统计局（2013a）。2013年德文波特-塔卡普纳地方董事会区域人口普查快速统计。技术报告。可从以下URL获得：http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx？request_value=13613&parent_id=13170&tabname=&sc_device=pdf
[38]	新西兰统计局（2013b）。2013年人口普查——芙蓉和海湾当地董事会区域快速统计。技术报告。可从以下URL获得：http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx？request_value=13610&parent_id=13170&tabname=&sc_device=pdf
[39]	新西兰统计局（2013年c）。2013年人口普查关于Patumahoe的快速统计。技术报告。可从以下URL获得：http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx？request_value=13452&tabname=工作&sc_device=pdf
[40]	新西兰统计局（2013年d）。2013年人口普查-彭罗斯快速统计。技术报告。可从以下URL获得：http://archive.stats.govt.nz/Census/2013人口普查/概况和摘要报告/quickstats‐关于‐a‐place.aspx？request_value=13427&parent_id=13171&tabname=&sc_device=pdf
[41]	Sturm，B.和Christensen，M.（2012年）。正交匹配追踪实现的比较。第20届欧洲信号处理会议记录（EUSIPCO），第220-224页。
[42]	Tibshirani，R.（1996年）。通过Lasso进行回归分析和选择。英国皇家统计学会杂志，B辑，58267-288·Zbl 0850.62538号
[43]	Tibshirani，R.J.和Taylor，J.（2012）。拉索问题的自由度。《统计年鉴》，第40期，第1198-1232页·Zbl 1274.62469号
[44]	Turlach，B.（2005）。关于在条件下求解最小二乘问题的算法 [（{\ell}_1\]\）罚款或 [（{\ell}_1\]\）约束。《美国统计协会会刊》，统计计算部分，第2572-2577页。
[45]	Wallace，C.（2005）。通过最小消息长度进行统计推断和归纳推断。纽约：Springer Science+Business Media·Zbl 1085.6202号
[46]	Wong，C.、Makalic，E.和Schmidt，D.（2018年）。使用重尾先验分布的泊松和几何模型的最小消息长度推断。《数学心理学杂志》，83，1-11·Zbl 1404.62010年
[47]	Yang，Y.（2016）。空气污染物PM_2.5浓度的预测模型（硕士论文）。奥克兰：奥克兰大学。可从以下URL获得：http://hdl.handle.net/2292/29431

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

利用贪婪算法和信息论准则选择预测因子。（英语） Zbl 1521.62159号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

利用贪婪算法和信息论准则选择预测因子。 （英语） Zbl 1521.62159号

MSC公司：

关键词：

软件：

参考文献：

利用贪婪算法和信息论准则选择预测因子。（英语） Zbl 1521.62159号