×

兹马思-数学第一资源

基于回归树的流数据区间预测。(英语) Zbl 07363863
摘要:在预测中,我们通常需要区间预测,而不仅仅是一个特定的点预测。为了有效地跟踪流数据,这种间隔预测应该可靠地覆盖观测到的数据,但要尽可能窄。为此,我们提出了两种基于回归树的方法:一种是集成方法,另一种是基于单一树的方法。对于集成方法,我们使用最新模型的加权结果,对于单树方法,我们保留一个模型,直到有必要训练一个新模型。我们提出了一种新的方法,利用最近一批数据计算出的均方根预测误差自适应地更新区间预测。我们使用小波变换数据来获取长时间变量信息,并使用条件推理树作为底层回归树模型。结果表明,这两种方法都有很好的效果,覆盖率高,且间隔不太宽。当底层数据生成机制发生变化时,它们的性能最初会受到影响,但随着时间的推移,它们的性能可以相对较快地恢复。与集成方法相比,基于单个树的方法在计算(CPU)时间方面表现最好。与ARIMA和GARCH模型相比,我们的方法可以获得更好或相似的覆盖率和宽度,但所需的CPU时间要少得多。
理学硕士:
62M10 统计学中的时间序列、自相关、回归等(GARCH)
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Appice A,Ceci M(2006)用模型树挖掘公差区域。国际智能系统方法学研讨会。斯普林格,第560-569页
[2] Baena García M,del Campo-Ávila J,Fidalgo R,Bifet a,GavaldáR,Morales Bueno R(2006)早期漂移检测方法。第四届数据流知识发现国际研讨会
[3] Bifet A,GavaldáR(2007)通过自适应窗口从时变数据中学习。2007年暹罗国际数据挖掘会议记录。暹罗,第443-448页
[4] Bifet A,GavaldáR(2009)《从不断变化的数据流中自适应学习》。国际智能数据分析研讨会。斯普林格,第249-260页
[5] Bifet A,Holmes G,Pfahringer B,Kirkby R,GavaldáR(2009)《演化数据流的新集成方法》。第15届ACM SIGGDD知识发现与aata采矿国际会议论文集。ACM,第139-148页
[6] 比菲。;福尔摩斯,G。;柯克比,R。;Pfahringer,B.,MOA:大规模在线分析,J Mach Learn Res,111601-1604(2010)
[7] Domingos P,Hulten G(2000)挖掘高速数据流。第六届ACM-SIGKDD国际知识发现与数据挖掘会议论文集。ACM,第71-80页
[8] 杜阿尔特,J。;加马,J。;Bifet,A.,来自高速数据流的自适应模型规则,ACM Trans Knowl Discov data(TKDD),10,3,30(2016年)
[9] Gama J,Medas P,Castillo G,Rodrigues P(2004)漂移检测学习。巴西人工智能研讨会。斯普林格,第286-295页·Zbl 1105.68376
[10] Ghalanos A(2014)rugarch:单变量GARCH模型。R程序包版本1.3-5
[11] Gholipour A,Hosseini MJ,Beigy H(2013),非平稳数据流的自适应回归树。第28届应用计算学术研讨会论文集。ACM,第815-817页
[12] Hothorn T,Zeileis A(2015)partykit:R.J Mach Learn Res 16:3905-3909中的递归partykit模块化工具箱。http://jmlr.org/papers/v16/hothorn15a.html·Zbl 1351.62005
[13] 霍霍恩,T。;霍尼克,K。;Van De Wiel,马萨诸塞州;Zeileis,A.,一个用于条件推理的乐高系统,Am Stat,60,3,257-263(2006)
[14] 霍霍恩,T。;霍尼克,K。;Zeileis,A.,无偏递归划分:条件推理框架,J Comput Graph Stat,15,3651-674(2006)
[15] Hyndman RJ(2017)预测:时间序列和线性模型的预测函数。http://pkg.robjhyndman.com/forecast。R程序包版本8.2
[16] Hyndman RJ,Khandakar Y(2008).自动时间序列预测:R.J Stat软件的预测包26(3):1-22。http://www.jstatsoft.org/article/view/v027i03
[17] 伊科诺莫夫斯卡。;加马,J。;Džeroski,S.,《从演化的数据流中学习模型树》,data Min Knowl Disc,23,1128-168(2011)·Zbl 1235.68158
[18] 伊科诺莫夫斯卡。;加马,J。;Džeroski,S.,进化数据流回归的在线基于树的集合和选项树,神经计算,150458-470(2015)
[十九] Jin R,Agrawal G(2003)流数据的高效决策树构建。在:第九届ACM-SIGKDD知识发现和数据挖掘国际会议论文集,KDD'03,pp 571-576,纽约,纽约,美国。ACM公司。国际标准书号1-58113-737-0。数字标识码:10.1145/956750.956821
[20] 科斯拉维,A。;纳哈万迪,S。;Creighton,D.,自适应神经模糊推理系统的预测区间构造与优化,IEEE Trans-Fuzzy系统,19,5,983-988(2011)
[21] 克劳茨克,B。;Cano,A.,漂移和噪声数据流的在线集成学习,Appl Soft Comput,68677-692(2018年)
[22] 米兰,Z。;泰勒,C。;阿姆斯特朗,D。;戴维斯,P。;罗伯茨S。;鲁普尼克,B。;Suddle,A.,术前使用β受体阻滞剂是否会影响肝移植术中血流动力学特征和术后病程?,《Transpl Proc》,48,1,111-115(2016)
[23] Nishida K,Yamauchi K(2007)使用统计检验检测概念漂移。国际发现科学会议。斯普林格,第264-269页
[24] 珀西瓦尔,分贝;华登,AT,时间序列分析的小波方法(2000),剑桥:剑桥大学出版社,剑桥
[25] Pfahringer B,Holmes G,Kirkby R(2007)《锄地的新选择》。澳大利亚人工智能联合会议。斯普林格,第90-99页
[26] 全,H。;斯里尼瓦桑。;Khosravi,A.,使用基于神经网络的预测间隔的短期负荷和风电预测,IEEE跨神经网络学习系统,25,2303-315(2014)
[27] R核心团队(2014)R:统计计算的语言和环境。R统计计算基金会,维也纳,奥地利。http://www.R-project.org/
[28] 罗斯,乔治亚州;NM,亚当斯;丹麦塔苏利斯;Hand,DJ,用于检测概念漂移的指数加权移动平均图,模式识别Lett,33,2191-198(2012)
[29] 塞提,TS;Kantardzic,M.,《流式未标记数据概念漂移的可靠检测》,专家系统应用,8277-99(2017)
[30] Shrestha,科罗拉多州;Solomatine,DP,模型输出预测区间估计的机器学习方法,神经网络,19,2225-235(2006)·Zbl 1160.68516
[31] 索巴尼,P。;Beigy,H.,新的数据流漂移检测方法,Adapt Intell Syst,6943,88-97(2011)
[32] Whitcher B(2013)waveslim:一维、二维和三维信号处理的基本小波程序。http://CRAN.R-project.org/package=waveslim。R包版本1.7.3
[33] Wuertz D,Setz T,Chalabi Y,Boudt C,Chausse P,Miklovac M(2019)fGarch:Rmetrics自回归条件异方差建模。https://CRAN.R-project.org/package=fGarch。R包版本3042.83.1
[34] 吉田,S-I;哈塔诺,K。;Takimoto,E。;Takeda,M.,使用加权窗口的自适应在线预测,IEICE Trans,94-D,1917-1923(2011)
[35] 赵,X。;理发师。;泰勒,CC;Milan,Z.,使用小波变换时间序列的面板数据分类树方法,Comput Stat data Anal,127,204-216(2018)·Zbl 1469.62182号
此参考列表基于出版商或数字数学图书馆提供的信息。它的数学和标识符可能包含启发式匹配的数据项。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。