×

使用机器学习模型的降雨量预测方法及其在福冈市案例中的应用。 (英语) Zbl 1283.68305号

小结:在本文中,尝试导出最佳数据驱动机器学习方法,用于预测日本福冈市的日平均和月平均降雨量。本对比研究集中在三个方面:建模输入、建模方法和预处理技术。将线性相关分析与平均互信息进行比较,以找到最佳输入技术。对于降雨的建模,提出了一种新的混合多模型方法,并与其组成模型进行了比较。这些模型包括人工神经网络、多元自适应回归样条、最近邻和径向基支持向量回归。这些方法中的每一种都被应用于日降雨量和月降雨量的建模,并结合了包括移动平均值和主成分分析在内的预处理技术。在混合方法的第一阶段,使用不同的参数设置构建上述每种方法的子模型。在第二阶段,使用变量选择技术对子模型进行排序,并根据遗漏交叉验证误差选择排名较高的模型。通过对最终选择的模型进行加权组合,对混合模型进行预测。

MSC公司:

68T05型 人工智能中的学习和自适应系统
86A10美元 气象学和大气物理学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abrahart,R.J.和See,L.(2002年)。河流流量预测的多模型数据融合:基于两个对比流域的六种备选方法的评估,水文学和地球系统科学6(4):655-670·doi:10.5194/小时-6-655-2002
[2] Baruque,B.、Porras,S.和Corchado,E.(2011年)。使用拓扑保持聚类的混合分类集成,新一代计算29(3):329-344·文件编号:10.1007/s00354-011-0306-x
[3] Chalimourda,A.,Scho“lkopf,B.和Smola,A.J.(2004)。不同噪声模型和参数设置下支持向量回归的实验最优值,神经网络:国际神经网络学会官方期刊17(1):127-41·Zbl 1072.68541号 ·doi:10.1016/S0893-6080(03)00209-0
[4] Cherkassky,V.和Ma,Y.(2004)。SVM参数的实际选择和SVM回归的噪声估计,神经网络:国际神经网络学会官方期刊17(1):113-26·Zbl 1075.68632号 ·doi:10.1016/S0893-6080(03)00169-2
[5] Coulibaly,P.、Hache,M.、Fortin,V.和Bobeé,B.(2005)。利用模型组合改进每日水库流入量预测,《水文工程杂志》10(2):91·doi:10.1061/(ASCE)1084-0699(2005)10:2(91)
[6] Dawson,C.W.和Wilby,R.L.(2001)。使用人工神经网络进行水文建模,《自然地理学进展》25(1):80-108。
[7] De Vos,N.J.和Rientjes,T.H.M.(2005)。人工神经网络对降雨径流建模的限制:水文状态表示和模型评估的权衡,《水文学与地球系统科学》9(1-2):111-126·doi:10.5194/hesss-9-111-2005
[8] 邓玉凤、金霞和钟玉霞(2005)。用于时间序列预测的集成SVR,《机器学习与控制论国际会议论文集》,中国广州,第2卷,第734-748页。
[9] Diebold,F.X.和Mariano,R.S.(1995年)。比较预测准确性,《商业与经济统计杂志》13(3):253-263。
[10] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004)。最小角回归,《统计学年鉴》32(2):407-499·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[11] Everingham,Y.L.,Smyth,C.W.和Inman-Bamber,N.G.(2009年)。集成数据挖掘方法预测区域甘蔗作物产量,农业和森林气象149(3-4):689-696·doi:10.1016/j.agrformet.2008.10.018
[12] Fraley,C.和Hesterberg,T.(2009年)。大数据集的最小角度回归和LASSO,统计分析和数据挖掘1(4):251-259。
[13] Fraser,A.M.和Swinney,H.L.(1986年)。来自相互信息的奇怪吸引子的独立坐标,《物理评论》A 33(2):1134-1140·Zbl 1184.37027号 ·doi:10.1103/PhysRevA.33.1134
[14] Friedman,J.H.(1991)。多元自适应回归样条,统计年鉴19(1):1-67·Zbl 0765.62064号 ·doi:10.1214操作系统/1176347963
[15] Gheyas,I.A.和Smith,L.S.(2011年)。用于时间序列预测的新型神经网络集成架构,神经计算74(18):3855-3864。
[16] Hastie,T.、Tibshirani,R.和Friedman,J.(2009年)。《统计学习的要素:数据挖掘、推断和预测》,第二版。,纽约州纽约州施普林格·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[17] Hong,W.(2008)。通过技术机器学习模型进行降雨量预测,应用数学与计算200(1):41-57·Zbl 1164.86025号 ·doi:10.1016/j.amc.2007.10.046
[18] Hyndman,R.J.、Slava R.和Schmidt,D.(2012年)。预测:时间序列和线性模型的预测功能,R包3.19版,http://CRAN.R-project.org/package=预测
[19] Kim,T.、Heo,J.-H.和Jeong,C.-S.(2006年)。使用多目标遗传算法对汉江流域多水库系统进行优化,水文过程20(9):2057-2075·doi:10.1002/hyp.6047
[20] Kitanidis,P.K.和Bras,R.L.(1980)。概念水文模型实时预测,2:应用和结果,水资源研究16(6):1034-1044·doi:10.1029/WR016i006p01034
[21] Lee,C.F.、Lee,J.C.和Lee,A.C.(2000)。《商业和金融经济学统计》,第二版。,新加坡世界科学·Zbl 1281.62225号 ·数字对象标识代码:10.1007/978-1-4614-5897-5
[22] Legates,D.R.和McCabe,G.J.(1999)。《评估在水文和水文气候模型验证中使用“质量”指标的情况》,《水资源研究》35(1):233-241·doi:10.1029/1998WR900018
[23] Li,P.W.和Lai,E.S.T.(2004)。香港短期定量降水预报,发展288(1-2):189-209。
[24] Myers,R.H.(1990年)。经典和现代回归与应用,马萨诸塞州波士顿市达克斯伯里。
[25] Nash,J.和Sutcliffe,J.(1970年)。通过概念模型进行河流流量预测,I:原理讨论,《水文学杂志》10(3):282-290·doi:10.1016/0022-1694(70)90255-6
[26] Newbold,P.、Carlson,W.和Thorne,B.(2007年)。《商业与经济统计》,第6版。,新泽西州上鞍河普伦蒂斯·霍尔。
[27] Pucheta,J.、Patino,D.和Kuchen,B.(2009年)。基于单点观测的月降雨量预测的统计相关方法,D.Li和Z.Chunjiang,《农业中的计算机和计算技术II》,第2卷,IFIP信息和通信技术进展,第294卷,Springer,Boston,MA,第787-798页。
[28] Racine,J.(2000)。依赖数据的一致交叉验证模型选择:高压区块交叉验证,计量经济学杂志99(1):39-61·Zbl 1011.62118号 ·doi:10.1016/S0304-4076(00)00030-0
[29] Siwek,K.、Osowski,S.、Szupiluk,R.(2009)。电力系统准确负荷预测的集成神经网络方法,国际应用数学与计算机科学杂志19(2):303-315,DOI:10.2478/v10006-009-0026-2·Zbl 1167.93338号 ·doi:10.2478/v10006-009-0026-2
[30] Schölkopf,B.和Smola,A.J.(2002年)。使用内核学习:支持向量机、正则化、优化及其超越,自适应计算和机器学习,第98卷,麻省理工学院出版社,马萨诸塞州剑桥。
[31] Schoölkopf,B.和Smola,A.J.(2004)。支持向量回归教程,统计与计算14(3):199-122。
[32] Shrestha,D.L.和Solomatine,D.P.(2006)。模型输出预测区间估计的机器学习方法,神经网络19(2):225-235·Zbl 1160.68516号 ·doi:10.1016/j.neunet.2006.01.012
[33] Solomatine,D.P.和Ostfeld,A.(2008)。数据驱动建模:一些过去的经验和新方法,《流体信息学杂志》10(1):3。
[34] Sudheer,K.P.、Gosain,A.K.和Ramasastri,K.S.(2002年)。用于构建人工神经网络降雨径流模型的数据驱动算法,水文过程16(6):1325-1330·doi:10.1002/hyp.554
[35] Syed,A.R.(2011)。交叉验证和自适应模型选择综述,《统计学,数学论文》,乔治亚州立大学,佐治亚州阿兰塔,论文99。
[36] Timmermann,A.(2006)。预测组合,见G.Elliott、C.Granger和A.Timmermann,《经济预测手册》,阿姆斯特丹爱思唯尔,第4章,第135-196页。
[37] Wichard,J.(2011)。用混合模型预测NN5时间序列,国际预测杂志27(3):700-707。
[38] Wichard,J.和Ogorzalek,M.(2007年)。将集合模型应用于CATS基准的时间序列预测,神经计算70(13-15):2371-2378。
[39] Wu,C.、Chau,K.和Li,Y.(2008)。基于分布式支持向量回归的河道水位预测,《水文学杂志》358(1-2):96-111。
[40] Xiong,L.、Shamseldin,A.Y.和Oconnor,K.(2001)。一阶Takagi-Sugeno模糊系统对降雨径流模型预测的非线性组合,《水文杂志》245(1-4):196-217·doi:10.1016/S0022-1694(01)00349-3
[41] Yang,Y.,Lin,H.,Guo,Z.和Jiang,J.(2007)。基于卫星图像序列分析的暴雨预报数据挖掘方法,计算机地球科学33(1):20-30·doi:10.1016/j.cageo.2006.05.010
[42] Zaman,M.和Hirose,H.(2011年)。带小训练集的打包和增强型集成方法的分类性能,新一代计算29(3):277-292·doi:10.1007/s00354-011-0303-0
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。