杂志的下一篇文章
家用燃气炉污染物迁移的CFD和多区模型比较
下一篇特刊文章
北京城区连续霾和非霾天气期间大气VOCs水平和来源的变化——以2019年春季为例
期刊/特刊上的前一篇文章
PM的空间特征2.5华北平原北部城市间污染及其政策含义
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

一种用于PM预测的新型混合机器学习方法(OR-ELM-AR)2.5浓度及其预测性能评估

1
上海大学经济学院,上海200444
2
上海大学环境与化学工程学院,上海200444
上海大学有机化合物污染控制工程重点实验室,上海200444
4
泰国曼谷通武里国王科技大学能源与环境联合研究生院,邮编:10140
5
泰国曼谷10140,高等教育、科学、研究和创新部能源技术与环境卓越中心
*
应向其发送信件的作者。
收到的提交文件:2020年11月27日/修订日期:2020年12月31日/接受日期:2021年1月2日/发布日期:2021年1月6日
(本文属于特刊空气质量管理)

摘要

:
PM的准确预测2.5在雾霾污染频发的许多城市,及时防治雾霾的污染是非常必要的。在这项工作中,使用了在线数据更新的在线递归极端学习机(OR-ELM)技术来预测PM2.5首次提出了一种结合自回归(AR)模型的混合模型(OR-ELM-AR),以增强其捕捉小时PM变化的预测能力2.5浓度。对中国长江三角洲地区的污染水平、预测时间和空间分布进行了预测性能评估。结果表明,OR-ELM-AR模型能够快速响应短期变化,具有更好的预测性能。因此,OR-ELM-AR模型是一种很有前景的空气污染预测工具,可以支持政府采取紧急行动,降低城市或地区雾霾污染的频率和严重程度。

图形摘要

1.简介

随着城市化和经济的快速发展,中国面临着严重的雾霾污染,细颗粒物(PM2.5)近几十年来超过空气质量标准[1,2,,4]. 高浓度PM2.5不仅影响人们的日常生活和健康,还对社会经济和气候变化产生负面影响[5,6,7]. 因此,预测PM是至关重要的2.5提前准确浓缩,以便政府及时做出决策并采取有效的应急控制措施,提前降低污染水平,从而保护公众健康。然而,每小时PM的准确预测2.5由于PM形成机制的复杂性,浓度仍然是一个巨大的挑战2.5[4,8,9,10]. PM的变化2.5浓度通常取决于排放量和气象条件的变化[2,10]. 此外,PM2.5正如许多研究报道的那样,与它们高度非线性相关[7,11].
近年来,研究人员对PM的预测做出了重大贡献2.5用机器学习方法浓缩[8,12,13]. 基于机器学习技术的预测模型通常分为两类,即离线模型和在线模型[14]. 离线模型可以进一步分为两个子类别,包括单一模型和混合模型。单一模型主要包括线性回归模型、灰色模型、贝叶斯、支持向量机、神经网络以及其他算法主导的人工智能方法。在许多研究中[7]采用自回归综合滑动平均模型(ARIMA)和混合logistic回归(MLR)等线性模型预测PM浓度2.5和PM10.如果PM2.5浓度序列是线性的,ARIMA和MLR的预测结果将更加可靠和具有解释性[15]. 然而,在实际情况中,颗粒物的时间变化是高度非线性、非平稳和不规则的序列。线性模型的局限性在于其预测过于依赖线性映射能力。与线性模型相比,非线性模型更适合预测极端浓度[6]. 人工神经网络(ANN)等人工智能算法作为一种典型的非线性模型,被广泛应用于颗粒浓度预测[8,13,16,17]. 然而,非线性模型有其自身的局限性。例如,它们很容易导致局部优化和过拟合问题[18]. 为了提高模型的预测性能,近年来越来越多的研究人员尝试使用混合模型[6,19,20]. 大多数混合模型由线性模型和非线性模型组成[19,21]. 随着混合模型的发展,“分解与聚合”的思想逐渐应用于时间序列的预测[22]作为确定性模型和统计模型的补充。研究表明,作为混合模型的一部分,“分解-集合”方法可以大大提高PM的准确性2.5预测[13,20].
然而,PM的时间序列数据2.5集中以数据流的形式出现,数据的分布随时间而变化[23,24]. 具有增量更新能力的在线学习模型应该更适合预测PM2.5PM非线性非平稳时间序列导致的浓度2.5数据。在线顺序极端学习机(OS-ELM)是一种新兴的在线学习算法,由[25]. 该模型用于预测大气中的特定物质,并取得了比ELM算法更好的预测性能[26]. 然而,OS-ELM有两个明显的缺点。一是输入权重无法调整;另一个是循环神经网络不能被训练。Park和Kim(2017)通过为递归神经网络(RNN)结构添加具有归一化和反馈输入的自动编码,克服了OS-ELM的缺点,提出了一种在线递归极端学习机(OR-ELM)来预测纽约市出租车乘客数[14]. 结果表明,OR-ELM能够快速适应模式变化,与OS-ELM和其他在线学习算法相比,预测误差最小[14]. OR-ELM模型已被证明是一种很有前途的工具,可以捕获具有快速更新能力的非线性和非平稳时间序列特征。然而,OR-ELM模型尚未用于每小时PM2.5到目前为止的预测。
在这项工作中,OR-ELM模型被应用于PM预测2.5第一次浓缩。此外,为了深入挖掘其残差信息,通过与基于OR-ELM模型的自回归(AR)模型耦合,提出了OR-ELM-AR混合模型。通过与基于不同时间段和污染水平的观测数据进行比较,进行性能评估。用平均误差(bias)、平均绝对误差(MAE)、均方根误差(RMSE)、一致性指数(IOA)、分数偏差(FBIAS)、分数误差(FERROR)和相关性(R)七个标准来评价预测性能。长江三角洲(YRD)地区41个地级市的空间预测性能也进行了检验,这是重PM之一2.5中国近几十年的污染地区。为了更好地理解OR-ELM-AR的预测性能,使用LSTM、OS-ELM和OR-ELM模型与OR-ELM-AR的预测性能进行比较。

2.方法和数据来源

2.1. 研究领域和数据源

YRD地区位于中国东部,是人口最稠密的地区之一,人口超过1.5亿,占中国总人口的11%。它也是中国经济最发达的地区之一。YRD地区由上海市和三个省组成,涵盖41个地级市,如图1南京、杭州和合肥分别是江苏、浙江和安徽省的省会城市。观测小时PM数据2.5可从中国城市空气质量实时发布平台获取浓度(http://106.37.208.233:20035/)该项目由中华人民共和国生态与环境部(MEEP)资助。这些数据的仪器操作和管理、数据质量保证和质量控制均严格遵守NAAQS指南(GB 3095-2012)。
我们在本研究中使用的训练数据是每小时PM的数据2.52017年1月1日00:00至2019年12月31日23:00在各城市连续观测到的浓度。对于每个城市,在使用过去200个PM样本进行培训后2.5浓度,建立模型以预测PM2.5第1至6小时的浓度。共有26280个样本,涉及每小时PM的数据2.5在此期间,一个城市的浓度被用作同一城市预测的训练数据。缺失数据占整个序列的0.6%。黄山市连续缺失数据的时间为12小时,因为空气质量最好,PM浓度较低2.5黄山市与YRD地区的其他城市相比,缺失数据的影响可以忽略不计。缺少的数据由时间序列中前几个小时的数据填充。

2.2. OR-ELM-AR模型框架及预测过程

基于OR-ELM模型[14],本研究开发了一种将在线序列极限学习机与AR模型相结合的混合模型(OR-ELM-AR),如图2它由三个神经网络和与AR模型的链接组成。OR-ELM-AR的核心是用于预测的递归神经网络(RNN),通过AR模型进行扩展,以从其残差中深入探索信息。两个单隐层前馈神经网络(ELM-auto-encoder,ELM-AE),称为ELM-AE1和ELM-AE2,分别学习RNN的输入权重和隐藏权重。将所有观测数据分为两部分,即训练数据集和测试数据集。训练数据集中的样本作为一批大小为200的样本按顺序输入到模型中,训练过程生成一个复杂的函数。此功能用于预测PM2.5测试数据集时间段内的浓度。预测性能可以通过比较测试数据集中的预测浓度和观测浓度,并借助几个指标进行评估。
OR-ELM-AR模型的培训过程包括以下三个阶段:
第1阶段:初始化阶段:
初始输入权重和隐藏权重被随机分配,平均值为零,标准偏差为一。通过完全在线初始化方法设置初始输出权重: β 0 = 0 ,   P(P) 0 = C类 1 ,其中是单位对角矩阵,并且C类是一个常量。
第二阶段:在线学习阶段
主要算法是通过递归最小二乘法(RLS)学习序列数据。输出重量如下:
β t吨 + 1 = RLS公司 ( , Z , λ )
RLS的定义如下:
W公司 t吨 + 1 = (f) n个 o个 第页
β t吨 + 1 = β t吨 + P(P) t吨 + 1 W公司 t吨 + 1 T型 Z W公司 t吨 + 1 β t吨
P(P) t吨 + 1 = 1 λ P(P) t吨 P(P) t吨 W公司 t吨 + 1 T型 ( λ 2 + λ W公司 t吨 + 1 P(P) t吨 W公司 t吨 + 1 T型 ) 1 W公司 t吨 + 1 P(P) t吨
哪里 是输入权重矩阵,并且 W公司 是输出权重矩阵。 N个 o个 第页   · 是归一化方法,称为层归一化(LN),用于避免退化问题。遗憾因素 λ 使算法能够不断忘记过时的数据并适应新的模式。如果 λ   =   1 ,没有遗憾。
训练样本更新后,通过RLS对输入权重进行相应更新,并依次对隐含权重进行更新,其中包含遗憾因子和隐含权重 t吨 如下所示:
更新   这个   输入   重量 :     =   t吨 + 1 T型 X(X) t吨 + 1
β t吨 + 1   =   RLS公司 ( , X(X) t吨 + 1 , λ )
更新   这个   隐藏   重量 :   小时 = t吨 + 1 小时 T型 W公司 t吨
β t吨 + 1 小时 = RLS公司 ( 小时 ,   W公司 t吨 , λ )
更新   这个   输出   重量 :   = t吨 + 1 X(X) t吨 + 1 + β t吨 + 1 小时 T型 W公司 t吨
β t吨 + 1 = RLS公司 ( ,   Y(Y) t吨 + 1 , 1 )
第三阶段:自回归阶段
根据方程式(11),残差 t吨 从OR-ELM的预测结果中提取,并进行自回归以生成新的残差 t吨 + 1 ,如式(12)所示。最后,PM的最终预测2.5浓度为 第页 第页 e(电子) d日 c(c) t吨 e(电子) d日 t吨 + 1 + t吨 + 1   .
t吨 = t吨 第页 e(电子) t吨 t吨 第页 第页 e(电子) d日 c(c) t吨 e(电子) d日 t吨
t吨 + 1 = φ 1 t吨 + φ 2 t吨 1 + φ t吨 2 + ε t吨 + 1

2.3. 评价方法

基于平均误差(bias)、平均绝对误差(MAE)、均方根误差(RMSE)、一致性指数(IOA)、分数偏差(FBIAS)、分数误差(FERROR)和相关系数(R)等统计指标,通过与观测数据的比较,对OR-ELM-AR的预测结果进行了评价。这些指标的定义如所示表1为了评估预测性能的稳健性,计算了不同情况下的这些指标:(1)从第一小时到第六小时的不同预测时间;(2) 在不同的PM2.5污染水平;(3) 分别在白天和夜间;(4) 整个YRD区域的预测空间分布。此外,还使用了LSTM、OS-ELM和OR-ELM,并将它们的性能与OR-ELM-AR进行了比较,以更好地理解OR-ELM-AR模型在预测能力方面的优势[27].

3.结果

3.1. PM的一般时空模式2.5污染

年度PM2.5达到的浓度应低于35μg/m根据国家环境空气质量标准(NAAQS)。项目经理2.52018年长江三角洲中部和北部地区城市集中度达不到标准,如图1(右),YRD北部地区的浓度仍然很高。为了探索PM的中长期趋势2.5污染变化,我们使用了20周(近5个月)的移动平均值,研究人员经常用它来描述中长期趋势[28].图S1显示了20周PM的移动平均值2.5三个不同典型城市(南京、上海和徐州)的浓度:上海的移动平均值低于60μg/m而徐州的含量远高于60μg/m对于大多数值。然而,这三个城市都呈现出与移动平均PM相同的季节模式2.5从11月到4月,浓度增加主要是因为冬季浓度较高,而从4月到10月,浓度下降主要是因为夏季浓度相对较低。1月、4月、7月和10月分别是YRD地区冬季、春季、夏季和秋季的代表月份。
从空间分布来看,重污染区主要集中在长江三角洲地区北部,其中安徽北部和江苏徐州的污染尤为严重(图1). 颗粒物2.5浙江南部几个城市的浓度已达到NAAQS标准。长江中下游地区和江苏沿海城市的污染处于中等水平。
平均PM的日变化2.5YRD地区41个城市的集中度如下所示图S2夏季浓度最低,冬季浓度最高。2019年4月的浓度明显低于前一年。季节和年份之间的差异不仅与排放变化有关,还与气象条件的变化有关。总的来说,下午有一个高峰2.5上午08:00至10:00,然后下降,晚上再次上升。
如所示图S2,平均PM2.52018年1月上海、南京和徐州的浓度均高于2017年同期。高峰均出现在上午11:00,上海和南京在夜间20:00-21:00出现第二个高峰。根据这三个城市观测到的小时浓度,相对较高的PM2.52018年1月,这三个城市的浓度和日变化主要受白天几次严重污染事件控制。2018年1月的重污染事件比2017年同期多,这也可以部分解释为总体PM2.52018年1月,YRD地区的浓度显著高于2017年同期。基于PM的平均日变化2.5整个YRD区域和这三个城市的浓度在夜间的变化相对温和,但在白天的变化可能非常剧烈。OR-ELM-AR模型在PM中白天(7:00–20:00)和夜间(21:00–6:00)预测能力的差异2.5本研究检测了浓度。

3.2. 模型参数的优化

共有26280个小时样本被重新安排,并按顺序以在线方式输入每个城市的预测训练数据集。每个训练数据集有两个部分。一部分是一组200个样本,这些样本被设置为模型的输入数据,另一部分是未来几个小时内的相应观测数据,这些数据是预测的目标数据。这些目标数据用于根据几个指标评估预测性能。在一段训练期间,输入一个训练数据集来更新模型中的三个权重,我们使用下一组数据来预测PM2.5接下来几个小时的集中注意力。
为了确保OR-ELM-AR模型实验的稳健性,研究了神经元数量和输入样本长度对预测性能的影响。随着神经元数量的增加,FBIAS和FERROR增加,而IOA和R减少,如图3(左)。神经元的数量为25个,在避免过度拟合和实现令人满意的操作效率方面都是最佳的。随着输入样本长度的增加,但小于200,FBIAS、IOA和R缓慢下降,而FERROR缓慢增加,因此我们选择输入长度参数为200,这足以提取时间序列的重要信息,并保持模型的鲁棒性[28].

3.3. 日间和夜间预测性能的比较

图S2显示PM2.5污染相对较高的城市在白天和夜间的污染模式明显不同。与夜间的浓度变化相比,白天的浓度变化通常更剧烈,这主要是由于各种人类活动和白天不断变化的气象条件造成的。这让我们怀疑PM的预测性能是否存在差异2.5在白天和晚上之间。我们假设早上7:00至晚上8:00为白天,其他时间段为夜间。小时PM预测性能的比较2.5YRD地区所有城市白天和夜间提前一小时的浓度如所示图4总体而言,OR-ELM-AR模型的预测性能表现出良好的稳定性。白天和夜间的R值均高于0.97。此外,夜间的R值达到0.983,高于白天,因为白天的影响因素较多。白天浓度波动较大,少数样品接近400μg/m.

3.4. 不同污染水平下的预测性能

根据中国政府发布的环境空气质量指数(HJ 633-2012)技术规定,空气质量状况分为六类:优、良、轻、中、重、重污染。我们评估了不同污染水平下的预测性能。在这里,由于严重污染天数有限,我们将严重污染和严重污染合并为一组进行预测绩效评估。通常,OR-ELM-AR算法的预测浓度接近所有污染水平的目标值,如所示图5从良好到中等污染水平,R系数从0.888逐渐下降到0.638,然后在重度和重度条件下上升到0.861(图5). 这表明OR-ELM-AR模型在低水平和高水平PM下具有稍好的适应性2.5浓度与中等污染水平相比。

3.5. 空间预测性能

小时PM的OR-ELM-AR模型的预测性能2.52019年整个长江三角洲地区的浓度预测如所示图6.圆圈的大小表示FERROR值。圆圈的颜色代表FBIAS值,整个城市区域地图中的颜色代表相应城市的IOA值。在此基础上,该图反映了六个子图中FBIAS、FERROR和IOA随预测时间和城市的变化。
随着预测时间从提前第一个小时到提前第六个小时的变化,长江三角洲地区所有城市的FEROR值都在增加,而IOA值逐渐减少,这表明当预测时间变长时,该模型的性能会受到影响。相比之下,FBIAS值在各个城市和预测时间的波动最小。这些城市在YRD地区的表现存在明显差异[29,30,31,32].
如所示图1,严重污染发生在YRD区域的北部,而污染最小的区域位于YRD区域南部和西部,以及YRD区域东部的舟山市。结合IOA的空间分布,如所示图6PM最低和最高区域的IOA值2.5浓度明显高于其他地区。这与之前的结果一致,即OR-ELM-AR模型在低水平和高水平PM下具有更好的适应性2.5集中度高于中等水平。此外,基于整个长江三角洲地区预测性能的空间分布,还表明预测性能随着提前预测时间的增加而减弱[32,33,34].
图7描述了YRD地区所有城市的预测绩效指标随预测时间变化的箱线图。这个x个-轴是预测时间,每个子图显示一个评估指标。随着预测时间的延长,FBIAS、FERROR、BIAS、MAE和RMSE的值逐渐增大,而IOA和R的值逐渐减小。这表明,OR-ELM-AR模型的总体预测性能随着预测时间的增加而缓慢下降。这些城市之间绩效指标的波动幅度逐渐变大,表明这些城市之间的绩效变得更加异质。与其他指标相比,FEEROR值的波动范围最小。对于FBIAS值,大多数值都在−0.05到0.05的窄范围内,这主要是因为OR-ELM-AR模型中包含了随机算法。
如所示图8在不同预测时间下,各指标与污染水平的变化趋势相似。在一定的预测时间内,FERROR值随PM的增加而略有下降2.5污染水平,而Bias、MAE和RMSE随着污染水平呈上升趋势,部分原因是PM2.5浓度可以放大这些指标的值。IOA和R具有相似的趋势,OR-ELM-AR的预测性能先是逐渐下降,然后随着污染水平的增加而增加。这表明,根据中等污染水平的IOA和R评估,预测性能相对较低,这与图5然而,根据IOA和R评估,在不同预测时间的相同污染水平下,表现并不最低。与其他预报时间的IOA和R的最低值相比,提前1小时预报的IOA值和R的最小值出现在PM浓度较高的时段2.5。提前6小时的预测在浓度间隔[35,75]时表现最低,之后表现更佳,如IOA和R值所示图8此外,就其中的任何指标而言,第一小时预报的表现都要比第六小时预报的好得多。

3.6. 与其他模型的比较

OR-ELM和OR-ELM-AR的预测在高浓度和低浓度下响应更快,偏差较小,如所示图S3.
根据每小时PM的预测2.52019年全年浓度,预报前1小时和2小时的残差呈钟形分布,结果相对集中稳定,如所示图9然而,从提前3小时开始,OS-ELM的残差呈现双峰分布,偏差较大。此外,LSTM的残差随着预测时间的增加而扩大[35]. LSTM残差在提前第四、第五和第六小时的偏度系数分别为0.4652、-0.7803和-0.026,表现出显著的正偏或负偏。OR-ELM-AR算法在同一预测时间具有接近零的偏态系数−0.1235、0.0288和0.0732的残差,显示出更稳定的预测,偏态更小。
与其他三种算法相比,OS-ELM的IOA值要低得多,但MAE、RMSE和FERROR值要高得多,如所示图10LSTM、OR-ELM和OR-ELM-AR模型具有相似的IOA值及其FERROR值。诚然,OR-LEM-AR的FEROR值仍然是最低的。LSTM的RMSE和MAE值都远大于OR-ELM-AR,预报时间提前1小时到6小时不等,表明OR-ELM-AR算法比LSTM算法具有更好的快速响应短期变化的能力。

4.结论

在这项工作中,使用在线递归极端学习机(OR-ELM)预测每小时PM2.5第一次集中注意力。混合模型(OR-ELM-AR)是在OR-ELM模型的基础上,结合AR模型开发的。OR-ELM-AR模型在逐时PM预测中的性能2.5对中国YRD地区的浓度进行了详细评估。主要结论如下:
(1)
项目经理2.5OR-ELM-AR在夜间的预报能力略优于白天,主要是受多种影响因素的影响,如人为源较多,白天气象条件变化较大;
(2)
OR-ELM-AR模型对低水平和高水平PM具有更好的预测性能2.5污染程度高于中等污染水平。特别是在重度和极端重度污染的情况下,该模型能够及时响应浓度的较大时间变化,预测值与观测值之间的相关系数较高。与长江三角洲中部的中度污染城市相比,长江三角洲地区污染最严重的北部城市和污染最少的南部和西部城市的预测性能更好;
(3)
通过嵌入式AR算法,OR-ELM-AR模型获得的RMSE和MAE值比OR-ELM模型小得多,FERROR值稍小。OS-ELM模型的预测性能最差;
(4)
OR-ELM-AR模型比基于RMSE和MAE指标的LSTM模型具有更好的快速响应能力,预测时间提前1小时到6小时不等,尽管它们的IOA值很接近。
总的来说,OR-ELM-AR模型是一种很有前途的PM短期预测工具2.5帮助政府采取紧急行动,降低城市或地区雾霾污染的发生率和水平。

补充资料

以下内容可在线获取,网址为https://www.mdpi.com/2073-4433/12/1/78/s1,图S1:移动平均PM的变化2.520周浓度随时间变化,图S2:观察到的PM平均浓度的日变化2.5整个YRD(a)区域,以及上海(b)、南京(c)、杭州(d)、合肥(e)和徐州(f)。图S3:不同提前期的OS-ELM、OR-ELM和OR-ELM-AR预测。所有作者都已阅读并同意手稿的出版版本。

作者贡献

概念化与写作,Y.W。;方法与写作,G.L。;可视化、E.Y.、H.L.和Z.L。;书写,哥伦比亚特区。;编辑,L.H.和K.M。;所有作者都阅读并同意手稿的出版版本。

基金

这项工作得到了国家重点研发计划(No.2018YFC0213600)、中国大气污染源与控制国家环境保护重点实验室(SCAPC202003)、上海市科技创新计划(No.19DZ1205007)、上海航海计划(No.19YF1415600)、,国家自然科学基金项目(NO.41875161)。

数据可用性声明

不适用。

致谢

我们感谢上海大学高性能计算中心和上海智能计算系统工程研究中心(编号:19DZ2252600)提供的计算资源和技术支持。

利益冲突

作者声明,他们没有已知的竞争性经济利益或个人关系,这些利益或关系似乎会影响本文报道的工作。

工具书类

  1. Chang,X。;王,S。;赵,B。;Xing,J。;刘,X。;Wei,L。;Song,Y。;Wu,W。;蔡,S。;郑浩。;等。城际和区域交通对PM的贡献2.5北京-天津-河北地区的浓度及其对区域联合空气污染控制的影响。科学。总环境。 2019,660, 1191–1200. [谷歌学者] [交叉参考]
  2. Cheng,N。;张,D。;李毅。;谢,X。;陈,Z。;孟,F。;高,B。;He,B.北京两次红色空气污染警报期间PM2.5浓度的时空变化和减排措施评估。科学。代表。 2017,7, 8220. [谷歌学者] [交叉参考] [绿色版本]
  3. Huang,L.等人。;An,J。;顾,B。;Yarwood,G。;Yan,R。;Wang,Y。;Huang,C.等人。;冬季浓雾事件中Li,L.硫酸盐的形成及非均匀SO的潜在贡献2+否2中国长江三角洲地区的反应。大气。化学。物理学。 2019,19, 14311–14328. [谷歌学者] [交叉参考] [绿色版本]
  4. 李凯。;雅各布·D·J。;廖,H。;朱,J。;沙阿,V。;沈,L。;贝茨,K.H。;张,Q。;翟,S.改善中国臭氧和颗粒物空气质量的双污染战略。自然地质学。 2019,12, 906–910. [谷歌学者] [交叉参考]
  5. Kan,H。;陈,R。;Tong,S.中国的环境空气污染、气候变化和人口健康。环境。国际。 2012,42, 10–19. [谷歌学者] [交叉参考] [公共医学]
  6. 李,Z。;Wang,Y。;郭杰。;赵,C。;克里布,M.C。;Dong,X。;范,J。;龚,D。;黄,J。;江,M。;等。东亚对流层气溶胶及其对区域云、降水和气候影响的研究(EAS-AIR CPC)。《地球物理学杂志》。Res.大气。 2019,124, 13026–13054. [谷歌学者] [交叉参考] [绿色版本]
  7. 林,H。;马伟(Ma,W.)。;邱,H。;王,X。;Trevathan,E。;姚,Z。;Dong,G.H。;沃恩,M.G。;钱,Z。;Tian,L.利用每日过量浓度小时数来探索香港环境PM2.5对短期死亡率的影响。环境。波卢特。 2017,229, 896–901. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  8. 黄,C.J。;Kuo,P.H.智能城市颗粒物(PM2.5)预测的深度CNN-LSTM模型。传感器(巴塞尔) 2018,18, 2220. [谷歌学者] [交叉参考] [绿色版本]
  9. Wang,Y。;Bao,S。;王,S。;胡,Y。;施,X。;Wang,J。;赵,B。;姜杰。;郑,M。;吴,M。;等。重霾天气期间北京地区和区域对细颗粒物的贡献。科学。总体环境。 2017,580, 283–296. [谷歌学者] [交叉参考]
  10. 郑,B。;张,Q。;Zhang,Y。;He,K.B。;王凯。;郑国杰。;Duan,F.K。;Ma,Y.L。;Kimoto,T.非均相化学:解释2013年1月华北地区霾事件期间二次无机气溶胶形成的现有模型中缺失的机制。大气。化学。物理学。 2015,15, 2031–2049. [谷歌学者] [交叉参考] [绿色版本]
  11. 刘,D。;Sun,K.基于CEEMD-RF的中国五个城市PM2.5短期预测。环境。科学。波卢特。Res.Int.公司。 2019,26, 32790–32803. [谷歌学者] [交叉参考]
  12. X·冯。;李强。;Zhu,Y。;Hou,J。;Jin,L。;Wang,J.使用基于地理模型和小波变换的空气质量轨迹人工神经网络预测PM2.5污染。大气。环境。 2015,107, 118–128. [谷歌学者] [交叉参考]
  13. 王,D。;Wei,S。;罗,H。;Yue,C。;Grunder,O。基于两相分解技术和改进的极值学习机的空气质量指数预测新混合模型。科学。总环境。 2017,580, 719–733. [谷歌学者] [交叉参考] [公共医学]
  14. 帕克,J.-M。;Kim,J.-H.在线递归极端学习机及其在时间序列预测中的应用。2017年5月14日至19日在美国阿拉斯加州安克雷奇举行的2017年国际神经网络联合会议(IJCNN)会议记录;第1983-1990页。[谷歌学者] [交叉参考]
  15. 玛莎,A。;N.K.Larkin,预测美国西部PM2.5的统计模型。J.空气废物管理。协会。 2019,69, 1215–1229. [谷歌学者] [交叉参考] [公共医学]
  16. 冯,R。;郑海杰。;高,H。;张,A.-R。;Huang,C.等人。;张建新。;罗,K。;Fan,J.-R.回归神经网络和随机森林用于大气污染物的分析和准确预测:中国杭州的案例研究。J.清洁。产品。 2019,231, 1005–1015. [谷歌学者] [交叉参考]
  17. 毛,X。;沈,T。;Feng,X.利用神经网络和卫星数据提前3天预测中国东部地面PM2.5小时浓度。大气。波卢特。物件。 2017,8, 1005–1015. [谷歌学者] [交叉参考]
  18. 高,S。;黄,Y。;张,S。;Han,J。;王,G。;张,M。;Lin,Q.使用GRU和LSTM网络进行短期径流预测,在样本生成期间无需时间步长优化。J.水文学。 2020,589, 125188. [谷歌学者] [交叉参考]
  19. Díaz-Robles,洛杉矶。;奥尔特加,J.C。;Fu,J.S。;里德,G.D。;周,J.C。;Watson,J.G。;Moncada-Herrera,J.A.,预测城市地区颗粒物的ARIMA和人工神经网络混合模型:智利特穆科案例。大气。环境。 2008,42, 8331–8340. [谷歌学者] [交叉参考] [绿色版本]
  20. 周,Q。;姜浩。;Wang,J。;周,J.PM的混合模型(2)。(5) 基于集合经验模式分解和通用回归神经网络的预测。科学。总环境。 2014,496, 264–274. [谷歌学者] [交叉参考]
  21. 默里,N.L。;霍姆斯,H.A。;刘,Y。;Chang,H.H.一种贝叶斯集合方法,用于结合使用卫星图像和数值模型模拟的统计模型的PM2.5估计值。环境。物件。 2019,178, 108601. [谷歌学者] [交叉参考]
  22. Yu,L。;戴,W。;Tang,L.一种新的带有扩展极值学习机的原油价格预测分解集成模型。工程应用。Artif公司。因特尔。 2016,47, 110–121. [谷歌学者] [交叉参考]
  23. 张,N.N。;马,F。;秦,C.B。;Li,Y.F.2013-2017年PM2.5水平时空变化趋势及中国大气污染联合防治区域划分。化学圈 2018,210, 1176–1184. [谷歌学者] [交叉参考] [公共医学]
  24. 刘,B。;Yan,S。;李,J。;Qu,G。;李毅。;朗·J。;Gu,R.基于n步递归预测的逐序空气质量预报器。IEEE接入 2019,7, 43331–43345. [谷歌学者] [交叉参考]
  25. 布埃诺,A。;科尔霍,G.P。;Bertini,J.R.基于极端学习机的在线序贯学习用于颗粒物预测。2017年10月2日至5日在巴西乌伯兰迪亚举行的2017年巴西智能系统会议(BRACIS)会议记录;第169-174页。[谷歌学者] [交叉参考]
  26. 黄,G。;梁,N。;荣,H。;萨拉昌德兰,P。;Sundararajan,N.在线顺序极端学习机器。2005年7月4日至6日,加拿大阿联酋卡尔加里,IASTED国际计算智能会议记录。[谷歌学者]
  27. 刘,H。;Xu,Y。;Chen,C.基于集合方法的改进污染预测混合算法。申请。数学。模型。 2019,73, 473–486. [谷歌学者] [交叉参考]
  28. James,J.简单趋势导向策略的稳健性。数量。财务。 2003,,C114–C116。[谷歌学者] [交叉参考]
  29. 卡纳达,M。;董,L。;Fujita,T。;Fujii,M。;井上,T。;Y.平野。;多哥,T。;Geng,Y.,中国区域差异与成本效益高的二氧化硫污染控制:以5个特大城市为例。能源政策 2013,61, 1322–1331. [谷歌学者] [交叉参考]
  30. 李,J。;杜,H。;王,Z。;孙,Y。;杨伟(Yang,W.)。;李,J。;唐,X。;Fu,P.华北平原特大城市群上空严重区域性冬季雾霾事件的快速形成。环境。波卢特。 2017,223, 605–615. [谷歌学者] [交叉参考]
  31. 王,Q。;Kwan,M.P。;周,K。;范,J。;Wang,Y。;Zhan,D.城市化对细颗粒物(PM2.5)浓度的影响:来自全球135个国家的经验证据。环境。波卢特。 2019,247, 989–998. [谷歌学者] [交叉参考]
  32. 翟,S。;雅各布·D·J。;王,X。;沈,L。;李凯。;Zhang,Y。;桂,K。;Zhao,T。;廖,H.中国细颗粒物(PM2.5)趋势,2013-2018:从人为排放和气象学中分离贡献。大气。化学。物理学。 2019,19, 11031–11041. [谷歌学者] [交叉参考] [绿色版本]
  33. 张,Q。;Quan,J。;领带,X。;李,X。;刘,Q。;高,Y。;Zhao,D.中国北京重霾事件期间气象和二次粒子形成对能见度的影响。科学。总环境。 2015,502, 578–584. [谷歌学者] [交叉参考]
  34. 赵,B。;王,S。;丁·D。;Wu,W。;Chang,X。;Wang,J。;Xing,J。;Jang,C。;Fu,J.S。;Zhu,Y。;等。北京-天津-河北地区空气污染物排放与PM2.5相关健康影响之间的非线性关系。科学。总环境。 2019,661, 375–385. [谷歌学者] [交叉参考] [公共医学]
  35. 赵,J。;邓,F。;蔡,Y。;Chen,J.用于PM2.5浓度预测的长短期记忆全连接(LSTM-FC)神经网络。化学圈 2019,220, 486–492. [谷歌学者] [交叉参考] [公共医学]
图1。长三角地区及其地级市的地理位置。
图1。长三角地区及其地级市的地理位置。
大气12 00078 g001
图2。混合机器学习方法(OR-ELM-AR)模型的主要框架。
图2。混合机器学习方法(OR-ELM-AR)模型的主要框架。
大气12 00078 g002
图3。性能随神经元数量的变化(左边)以及输入样本长度的长度(正确的).
图3。性能随神经元数量的变化(左边)以及输入样本长度的长度(正确的).
大气12 00078 g003
图4。预测和目标细颗粒物(PM)的散点图2.5)基于白天OR-ELM-AR的浓度()在晚上(b条).
图4。预测和目标细颗粒物(PM)的散点图2.5)基于白天OR-ELM-AR的浓度()在晚上(b条).
大气12 00078 g004
图5。不同污染水平下预测结果和目标的比较。
图5。不同污染水平下预测结果和目标的比较。
大气12 00078 g005
图6。分数偏差(FBIAS)、分数误差(FERROR)和一致性指数(IOA)随预测时间变化的城市分布。
图6。分数偏差(FBIAS)、分数误差(FERROR)和一致性指数(IOA)随预测时间变化的城市分布。
大气12 00078 g006
图7。不同预测时间的绩效指标箱线图。
图7。不同预测时间的绩效指标箱线图。
大气12 00078 g007
图8。OR-ELM-AR模型在不同污染水平下的预测性能。
图8。OR-ELM-AR模型在不同污染水平下的预测性能。
大气12 00078 g008
图9。极值学习机(OS-ELM)、在线递归极值学习机器(OR-ELM)、OR-ELM-AR和LSTM模型的残差分布。
图9。极值学习机(OS-ELM)、在线递归极值学习机器(OR-ELM)、OR-ELM-AR和LSTM模型的残差分布。
大气12 00078 g009
图10。四种模型的预测性能比较。
图10。四种模型的预测性能比较。
大气12 00078 g010
表1。预测绩效评估的统计指标。
表1。预测绩效评估的统计指标。
统计的定义笔记
平均误差(偏差) B类 = 1 N个 ( M(M) ) 浓度单位
平均绝对误差(MAE) M(M) E类 = 1 N个 | M(M) | 浓度单位
平方根误差(RMSE) R(右) M(M) S公司 E类 = 1 N个 ( M(M) ) 2 浓度单位
协议索引(IOA) = 1 ( M(M) ) 2 | M(M) ¯ | + | ¯ | 2 无单位,0≤IOA≤1
分数偏差(FBIAS) F类 B类 S公司 = 2 N个 ( M(M) ) ( M(M) + ) −2≤FBIAS≤2
分数误差(FERROR) F类 E类 R(右) R(右) R(右) = 2 N个 | M(M) | ( M(M) + ) 0≤铁≤2
相关性(R) c(c) o个 第页 第页 = ( M(M) M(M) ¯ ) ( ¯ ) ( M(M) M(M) ¯ ) 2 ( ¯ ) 2 −1 ≤校正≤ 1
注:。下标j表示N个观测值M与预测值P按时间配对。上横线表示随时间变化的方式。
出版商备注:MDPI对公布的地图和机构关联中的管辖权主张保持中立。

分享和引用

MDPI和ACS样式

卢,G。;Yu,E。;Wang,Y。;李,H。;Cheng,D。;黄,L。;刘,Z。;Manomaiphiboon,K。;李,L。一种用于PM预测的新型混合机器学习方法(OR-ELM-AR)2.5浓度及其预测性能评估。大气 2021,12, 78.https://doi.org/10.3390/atmos12010078

AMA风格

Lu G,Yu E,Wang Y,Li H,Cheng D,Huang L,Liu Z,Manomaiphiboon K,Li L。一种用于PM预测的新型混合机器学习方法(OR-ELM-AR)2.5浓度及其预测性能评估。大气. 2021; 12(1):78.https://doi.org/10.3390/atmos12010078

芝加哥/图拉宾风格

Lu、Guibin、Enping Yu、Yangjun Wang、Hongli Li、Dongpo Cheng、Ling Huang、Ziyi Liu、Kasemsan Manomaiphiboon、,和李丽。2021.“用于PM预测的新型混合机器学习方法(OR-ELM-AR)2.5浓度及其预测性能评估”大气12,编号1:78。https://doi.org/10.3390/atmos12010078

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章指标

返回页首顶部