杂志的下一篇文章
SWAT在复杂山区流域水文模拟中的应用(第二部分:气候变化影响评估)
下一篇特刊文章
机器学习与城市排水系统:现状综述
期刊上的上一篇文章
黑河城市河流沉积物中古生物群落的微生物分布驱动因素研究——以漳河流域为例
特刊上一篇文章
基于深度学习的海水盐分颗粒分类方法
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

基于混合深度学习神经网络的水质参数实时监测预测模型比较

1
天津师范大学天津市水资源与环境重点实验室,天津300387
2
清华大学水利科学与工程国家重点实验室,北京100084
*
应向其寄送信件的作者。
2021,13(11), 1547;https://doi.org/10.3390/w13111547
收到日期:2021年5月12日/修订日期:2021年5月29日/接受日期:2021年5月30日/发布时间:2021年5月31日
(本文属于特刊液压系统的机器学习)

摘要

:
准确的实时水质预测对于当地环境管理人员应对即将发生的事件和紧急情况,制定最佳管理实践具有重要意义。本研究比较了不同深度学习(DL)模型和不同输入数据预处理方法在实时水质预测中的性能。有三种流行的DL模型,包括卷积神经网络(CNN)、长短期记忆神经网络(LSTM)和混合CNN-LSTM。应用了两种类型的输入数据,包括原始一维时间序列和基于带自适应噪声(CEEMDAN)分解的完全集成经验模式分解算法的二维灰度图像。在每个DL模型中使用每种类型的输入数据来预测溶解氧(DO)和总氮(TN)的实时监测水质参数。结果表明:(1)CNN-LSTM的性能优于独立模型CNN和LSTM;(2) 使用基于CEEMDAN的输入数据的模型比使用原始输入数据的模式表现得好得多,而非周期参数TN的改进远远大于周期参数DO的改进;(3)随着预测步长的增加,模型精度逐渐降低,而原始输入数据的衰减速度比基于CEEMDAN的输入数据快,非周期参数TN的衰减速度快于周期参数DO,通过CEEMDAN方法预处理的输入数据可以有效地提高深度学习模型的预测性能,这种改进对于TN的非周期参数尤其显著。

1.简介

地表水作为人类生活和工业生产最重要的水源,极易受到污染。通过量化不同类型的参数,水质监测可以帮助我们制定最佳管理实践,以保护水源安全和改善水生栖息地[1]. 随着社会经济的发展,由于地表水污染,水需求增加,可用水资源减少,中国许多地区面临着严峻的水压力[2]. 因此,准确、及时地监测和预测地表水水质对于当地环境管理人员制定减少污染战略和应对环境突发事件尤为重要。近年来,许多研究基于人工智能工具,通过不同的方法估计水质参数。例如,Fijani等人使用带自适应噪声的完全集合经验模式分解算法(CEEMDAN)和结合极端学习机(ELM)的变分模式分解算法设计了一种混合两层分解,以预测水库中的叶绿素a(Chl-a)和溶解氧(DO)[]. Chen等人利用2012年至2018年中国主要河流和湖泊的监测数据,比较了几种机器学习方法的水质预测性能[4]. Lu等人设计了两个基于混合决策树的模型来预测美国俄勒冈州污染最严重的Tualatin河的水质[5].
人工智能(AI)技术是近年来流行的基于数据的方法,已在许多领域成功开发用于预测非线性和非平稳时间序列。例如,神经模糊专家系统已被用于监测制浆造纸厂的腐蚀现象[6]. 将人工神经网络、支持向量机和自适应神经模糊推理系统(ANFIS)应用于复杂水文系统建模[7,8]. 将模糊逻辑和ANFIS应用于洪水预测[9]. 然而,与这些“浅层”建模方法相比,深度学习(DL)模型已在许多领域发展成为可靠的估计和预测工具,例如图像分类[10],语音识别[11]、新冠肺炎诊断和预后分析[12],降雨径流建模[12]和流量预测[13]. 在多种DL模型中,长短期记忆(LSTM)和卷积神经网络(CNN)是最常用的两种模型。Barzegar等人使用独立的LSTM和CNN以及混合的CNN–LSTM模型预测希腊小普雷斯帕湖的溶解氧和叶绿素a,发现混合模型优于独立模型[14]. Hao等人首先应用奇异谱分析和集合经验模式分解对数据进行预处理,发现LSTM模型的性能优于直接使用原始数据[15]. Wang等人使用基于小波的LSTM、CNN–LSTM和LSTM进行月径流和降雨量预测,发现LSTM适用于时间序列预测,但这两种混合模型是更好的替代方案[16]. 以往的研究表明,混合模型优于独立模型,预处理方法可以提高DL模型的性能。然而,在分析了这些研究之后,我们认为应该注意和考虑一些问题。首先,不同的参数代表不同的物质,因此这些参数的时间序列具有不同的波动特征。例如,溶解氧受温度影响很大,因此具有明显的季节变化[17]. 进入地表水中的过量总氮(TN)和总磷(TP)主要来自人类活动,季节变化不显著[18]. 我们想知道DL模型对不同参数是否具有令人满意的预测性能,以及混合模型是否总是表现得更好。其次,预处理方法是一种与数据相关的方法,因此随着数据的更新,模型框架逐渐变得不可靠。随着时间步长的增加,评估模型性能的变化可能有助于减少计算成本。最后,以往的研究一般先对数据序列进行分解,然后分别对每个分量进行预测,然后将这些预测结果相加,得到重构的时间序列。我们认为计算过程很复杂,想知道是否有一种简化的方法来实现准确的预测。
在本研究中,DL模型CNN、LSTM和CNN-LSTM被用于预测实时监测水质参数。这项研究使用了一个数据集,该数据集记录了2015年至2020年每四个小时的数据,数据来自中国新安江。选择DO和TN作为目标参数,利用原始时间序列对独立模型和混合模型进行训练和测试。此外,使用CEEMDAN模型对输入数据进行分解,并将分解矩阵用作二维灰度图像输入数据进行比较。本研究的主要目的是(1)比较基于原始输入数据和二维输入数据的结果,分析不同输入数据对模型性能的影响;(2) 比较不同参数的独立模型和混合模型的结果,分析参数波动特性对模型性能的影响;比较不同预测步骤的结果,分析预测步骤对不同参数和不同模型的影响。

2.材料和方法

2.1. 研究区域和数据描述

本文的案例研究区域是新安江,这是一条横跨安徽省和浙江省的跨界河流。新安江发源于安徽省黄山市,经浙江省淳安县流入千岛湖(图1). 新安江作为千岛湖最重要的入湖水源,其水质关系到安徽省和浙江省11591万人的健康[19]. 街口监测站位于两省交界处,主要用于监测新安江水质(图1). 街口站每4小时自动分析水样并记录数据,实现水质实时监测。我们收集了2015年5月6日0:00至2020年1月20日20:00的水质数据,包括溶解氧(DO)和总氮(TN)。DO和TN数据集都有10326条记录,用于建立预测模型。为了进行模型开发和评估,将整个数据集划分为训练、验证和测试子集。本研究中的数据划分标准如所示图2。训练、验证和测试子集包括6609条记录(近64%的数据集,从2015年5月6日0:00到2018年5月11日8:00)、1652条记录(约16%的数据集中,从2018年5月月11日12:00到2019年2月10日20:00)和2065条记录(将近20%的数据集),分别是。这两个参数的训练集、验证集和测试集的描述性统计汇总于表1.

2.2. 带自适应噪声的互补集成经验模式分解

CEEMDAN是一种改进的自适应信号时频分析方法[20]它是根据经验模式分解(EMD)开发的[21]和集合经验模式分解(EEMD)[22]. EMD可以将复杂信号分解为固有模式函数(IMF)和残差,以便更好地理解信号的线性和非线性特性。然而,由于单个IMF由非常不同的尺度组成,或者相似的尺度存在于不同的IMF组件中,因此原始EMD具有模式混合的缺点[]. 提出了EEMD方法,通过加入白噪声来解决模式混合问题[22]. 然而,在分解过程中添加的白噪声无法完全消除,因此信号和噪声之间的相互作用可能会产生不同的模式[23]. CEEMD算法通过在原始信号中加入正负辅助白噪声对,完全消除了残余白噪声,进一步提高了分解算法的性能[24]. 通过引入自适应噪声分量,CEEMDAN算法不仅保持了消除模式混合和残余噪声的能力,而且迭代次数少,收敛性能高[20]. 在本研究中,使用CEEMDAN对原始DO和TN数据序列进行分解,以降低其复杂性。

2.3. 卷积神经网络

卷积神经网络(CNN)是一种多层前馈神经网络,可用于处理多维数据,如时间序列数据(可被视为定期采样的一维网格)和图像数据(可视为像素二维网格)[25]. 随着CNN的应用,卷积网络结构出现了许多变体。然而,大多数网络的基本结构是相似的,包括输入层、卷积层、池层、全连接层和输出层[16,26]. 输入数据需要通过输入层进入卷积神经网络。根据观测数据和研究目标,输入层有多种格式,包括1-D、2-D甚至n-D,这些数据通常包含1到n个通道。本研究将原始时间序列视为一维网格数据,构建一维卷积网络。此外,将CEEMDAN预处理的原始数据分解为多频率IMF,并以图像的形式将其作为输入数据放入CNN。这些图像只有一个频道,基于它们构建的CNN可以被视为二维模型。
通过一系列对比实验,确定了本研究中使用的CNN模型的基本结构。在输入层之后,第二层是卷积层,包含许多可学习的卷积核。这些核的应用是通过学习输入数据的不同特征来获得多个特征图。第三层是激活层,使用整流线性单元(ReLU)作为激活函数。第四层是使用平均函数的池层。池层通过对从卷积层中提取的特征图进行子采样,降低了维数和处理时间。完全连接的层是输出层之前的最后一部分,它将池层的输出连接到一维行向量。最后,对于本研究的回归问题,回归输出层被用作CNN的最后一层。除了这些基本结构外,为了减少过拟合问题,本研究还使用了辍学和分批规范化方法[27]. 在每个训练案例中,Dropout以给定的概率随机地将输入元素设置为零,这样可以在合理的时间内训练大量不同的网络,从而有效地减少过拟合问题[28]. 批量归一化可以减轻内部协变量的偏移以及梯度对参数或其初始值的依赖性,从而达到加速训练和生成更可靠模型的目的[29].

2.4. 长短记忆神经网络

长短期记忆(LSTM)网络是递归神经网络(RNN)的一种特殊变体。在传统的前馈神经网络中,信息只能从输入层流向隐层,最后流向输出层。RNN和前馈神经网络之间最大的区别在于,RNN有一个递归隐藏单元,用于隐式地维护序列中所有过去元素的历史状态[30,31]. 也就是说,在RNN中,最终输出基于输入层的反馈和所有隐藏单元的历史状态。然而,当使用梯度下降法训练RNN时,梯度可能会呈指数增长或衰减,这将导致梯度爆炸或消失[31,32]. LSTM引入了输入和输出门的概念来改进RNN。LSTM采用存储单元,可以过滤和处理历史状态和信息,而不是RNN的递归隐藏单元,三个连续存储单元的基本结构如所示图3每个存储单元都包含一个输入门(t吨),遗忘之门((f)t吨)和输出门(O(运行)t吨)控制信息流。输入门(t吨)用于确定当前时刻(t)需要在单元格状态中存储多少输入数据,以及一个中间值 C类 t吨 ˜ 用于在此过程中更新状态。
t吨 = σ W公司 · 小时 t吨 负极 1 , x t吨 + b条
C类 ˜ t吨 = t吨 n个 小时 W公司 C类 · 小时 t吨 负极 1 , x t吨 + b条 C类
遗忘之门((f)t吨)确定前一时刻的单元格状态(t吨−1)需要保留到当前时刻。
(f) t吨 = σ W公司 (f) · 小时 t吨 负极 1 , x t吨 + b条 (f)
通过删除部分旧信息并添加筛选的中间值,单元状态从C类t吨−1C类t吨.
C类 t吨 = (f) t吨 C类 t吨 负极 1 + t吨 C类 ˜ t吨
输出门控制需要将多少当前单元格状态输出到新的隐藏状态。
o个 t吨 = σ W公司 o个 · 小时 t吨 负极 1 , x t吨 + b条 o个
小时 t吨 = o个 t吨 t吨 n个 小时 C类 t吨
在上述公式中, W公司 * b条 * 分别表示相关的权重矩阵和偏差向量,而 σ · t吨 n个 小时 · 是sigmoid函数和双曲正切函数。本研究中使用的LSTM模型的基本结构包括输入层、LSTM层、全连接层和回归输出层。为了防止过拟合,在完全连接层之前插入漏失层。
所有算法都是通过MATLAB R2020 b中的编程代码和Torres等人开发的函数来实现的[20]用于设计CEEMDAN模型。深度学习工具箱包括多个深度神经网络的基本框架,用于设计CNN、LSTM和CNN-LSTM模型。

2.5. 混合预测模型的发展

在构建预测模型之前,首先计算Lyapunov指数,以确定DO和TN数据序列中是否存在非线性和动态特征。当最大Lyapunov指数为正时,它是数据序列混沌特征的有力指示器。DO和TN的Lyapunov指数分别为0.36和0.44,表明这两个参数的监测数据都是混沌时间序列。对于混沌非线性动力学系统,数据可能被噪声破坏或其内部特征可能完全未知,因此深度学习方法非常适合于此类数据的预测和特征提取。在本研究中,我们研究了单一模型和混合模型在DO和TN的多步骤提前预测中的潜在应用。基于CNN和LSTM的水质预测模型的程序描述如下。
第1步:确定了解释变量和目标变量。虽然已经尝试了一些常用的分析方法(如自相关函数和偏自相关函数)来确定输入变量,但没有发现明显的滞后现象。考虑到监测频率和数据的有效性,选择两天内的12条记录作为输入变量,第二天的6条记录作为输出变量。以DO为例,输入和输出变量如所示表2.
第2步:DO和TN数据序列被分解为几个不同的IMF和一个残差分量。这些组件可以提供输入数据系列中包含的从高频到低频的详细信息。先前的研究表明,CEEMDAN建模过程中增加的噪声水平和实现次数可以根据应用情况进行调整[33]. 根据以往研究中的一些经验算法(例如,推荐的白噪声幅度约为标准偏差的20%等)和试错结果,设置了0.1的噪声级、100的实现以及最多2000次筛选迭代[,22,34].
步骤3:数据系列分别分为训练集、验证集和测试集。值得注意的是,尽管测试子集完全独立于训练过程,并用于比较模型的预测性能,但CEEMDAN的分解过程需要应用于整个数据集。如果将训练子集和测试子集分开分解,则得到的IMF和残差分量不一致,训练模型对测试数据无效。
第4步:训练子集用于训练每个模型进行多步预测。本研究包含两类输入数据:原始一维时间序列和基于CEEMDAN分解的二维灰度图像。原始的一维输入是一组12×1的数据序列,而基于CEEMDAN的输入是一个12×n的二维图像集(n的值取决于分解过程的结果)。一维和二维图像如所示图4分别是。每种类型的数据都用于训练三个深层神经网络:CNN、LSTM和CNN-LSTM。
第5步:使用测试子集获得多步预测结果,并比较不同模型的性能。由于训练过程中根本不涉及测试数据,因此测试数据集的预测结果能够很好地反映模型的泛化能力。同时,不同提前步骤的结果可用于评估模型的有效预测持续时间。

2.6. 评估标准

为了定量评估上述模型的性能,选择了三个统计评估标准进行比较,包括效率系数(总工程师)均方根误差(RMSE)和平均绝对百分比误差(MAPE)。这个总工程师也称为Nash–Sutcliffe系数,定义如下:
C类 E类 = 1 负极 = 1 n个 O(运行) 负极 P(P) 2 = 1 n个 O(运行) 负极 O(运行) ¯ 2
这个RMSE公司计算如下:
R(右) M(M) S公司 E类 = = 1 n个 O(运行) 负极 P(P) 2 n个
这个MAPE公司定义为:
M(M) A类 P(P) E类 = = 1 n个 P(P) 负极 O(运行) O(运行) n个 × 100 %
哪里n个是输入样本数,O(运行)P(P)样本的观察值和预测值分别是。 O(运行) ¯ 是观测数据的平均值。一般来说,CE值越大,RMSE和MAPE值越小,预测值与实际值之间的差异越小,即模型的预测精度越高。

3.结果和讨论

3.1. DO数据系列结果

基于CEEMDAN预处理方法,DO数据集的时间序列被分解为13个IMF和一个残差项,如所示图5这些IMF反映了不同时期DO的振荡模式,残差项反映了数据的趋势。在本研究中,输入数据有两种形式,一种是原始时间序列,另一种是基于CEEMDAN结果的灰度图像(图4). 原始输入是一组12×1的数据序列,而基于CEEMDAN的输入是一个12×14的二维图像集。显然,与单个时间序列相比,基于CEEMDAN的输入数据可以反映更多信息。此外,增加输入数据的维数有利于深度学习神经网络提取数据特征,从而提高预测精度。
DO数据集测试期间,单一和混合深度学习神经网络的CE、RMSE和MAPE统计如所示表3。对于具有不同前进步长的目标,最好的误差度量以红色突出显示。根据结果,可以发现CEEMDAN–CNN–LSTM模型对所有目标的预测精度最高。无论是单独的CNN和LSTM模型还是CNN-LSTM混合模型,基于CEEMDAN的输入数据的预测精度都优于原始输入数据。随着预测步长的增加,这两组输入数据之间的精度差异逐渐增大。例如,DO之间CE、RMSE和MAPE的差异t吨和DOt+5分CNN–LSTM和CEEMDAN–LSTM:0.09(|0.97–0.88|)、0.30(|0.35–0.65|)、2.61(|3.06–5.67|)和0.04(|0.98–0.94|)、0.22(|0.26–0.48|)和2.01(|2.55–4.56|)。换言之,随着预测步长的增加,基于CEEMDAN的输入数据的预测精度下降速度慢于原始输入数据。
这六个模型,特别是CEEMDAN–CNN–LSTM模型,可以捕捉测试数据系列在不同预测步骤中的总体趋势。然而,有必要根据峰值和最低值的预测来评估模型的准确性。在本研究中,分析了测试数据的10%最低值和10%最高值的观测值和预测值之间的MAPE。图6a、 c显示了基于原始输入和基于CEEMDAN的输入的从步骤1到步骤6的最低MAPE值。六种模型的MAPE随着预测步长的增加而增加,基于原始输入数据的MAPE大于基于CEEMDAN的输入。CNN模型的MAPE最大,LSTM模型第二,CNN–LSTM模型最小,这表明CNN–LSTM模型在预测最低值方面优于单独的模型。用于预测峰值(图6b、 d),基于CEEMDAN的输入的MAPE小于原始输入,并且MAPE随着预测步长的增加而增加。与最低值预测不同,LSTM是峰值预测MAPE最大的模型,其次是CNN模型,CNN–LSTM最小。因此,CEEMDAN–CNN–LSTM是最低和最高值的最佳预测模型。

3.2. TN数据系列的结果

使用CEEMDAN方法对TN数据序列的分解结果如所示图7TN数据集也被分解为13个IMF和一个残差项。TN数据集测试期间单个和混合深度学习神经网络的CE、RMSE和MAPE统计数据如所示表4结果表明,CEEMDAN–CNN–LSTM模型在不同的预测步骤中表现最佳。然而,对于TN的预测,从原始输入和基于CEEMDAN的输入得到的结果之间的差异非常显著。特别是随着时间步长的增加,原始输入的性能急剧恶化,而基于CEEMDAN的输入对TN预测显示出更好的稳定性。对于CNN、LSTM和CNN–LSTM模型,TN的CEn+3个,田纳西州n+4和TNn+5均小于0.5,不在令人满意的模型模拟范围内[35]. 换句话说,当时间步长超过3时,没有任何模型能够仅基于时间序列数据可靠地预测TN浓度。
TN测试数据集10%峰值和10%最低值的不同模型的MAPE如所示图8最低值的预测表明,CNN–LSTM优于CNN,而LSTM在三种模型中表现最差(图8a、 c)。对于原始输入和基于CEEMDAN的输入,三个模型在不同时间步长下的平均MAPE分别为39.20、41.71和51.72,以及26.07、28.12和31.30。显然,基于原始输入数据的最低值预测与观测值的偏差较大。根据峰值预测结果,LSTM模型表现最差,其次是CNN模型,CNN–LSTM模型的表现最好(图8b、 d)。此外,随着时间步长的增加,MAPE逐渐变大,即预测值与观测值之间的偏差变大。MAPE的变化曲线基本一致;然而,从原始输入中获得的MAPE大约是从基于CEEMDAN的输入中获得MAPE的两倍。总的来说,CEEMDAN–CNN–LSTM是预测TN极值的最佳模型,而LSTM是最不准确的极值预测模型。

4.讨论

许多研究应用了单一和混合深度学习模型来预测水文和水质数据[15,16,36]. 其中,最常用的方法是首先对数据序列进行分解,然后分别对每个IMF进行预测,最后将结果相加得到重构的时间序列。然而,数据分解是一种依赖于数据的方法,因此需要在数据更新时重复进行。一般来说,计算成本巨大,同时计算时间较长,因此常用的方法对于实时数据预测来说过于耗时。在本研究中,我们尝试将分解后的数据序列作为二维图像输入,用于多步骤水质预测。结果表明,与原始的一维时间序列输入数据相比,CEEMDAN方法分解的二维输入数据可以提高预测精度。然而,对于具有不同波动特征的水质参数,二维输入数据的预测精度有所提高。可以从中找到图4DO数据有非常明显的季节变化。春季和夏季的DO浓度高于秋季和冬季。由于DO数据具有较强的周期性,具有两类输入数据的独立模型和混合模型具有令人满意的性能。然而,混合模型的性能略优于独立模型,因此基于混合模型对结果进行了比较和讨论。对于DOt吨CNN–LSTM和CEEMDAN–CNN–LS TM的CE、RMSE和MAPE分别为0.97对0.98、0.35对0.26和3.06对2.55。CEEMDAN–CNN–LSTM模型的性能更好,但CNN–LSTM模型也可以捕捉数据的波动特征并做出准确的预测。图7结果表明,TN数据没有周期性波动特征,主要受人类活动影响。基于CEEMDAN输入数据的结果明显优于基于原始输入数据的效果。对于TNt吨CNN–LSTM和CEEMDAN–CNN–LS TM的CE、RMSE和MAPE分别为0.76对0.92、0.18对0.10和10.06对6.63。CEEMDAN–CNN–LSTM模型的性能显著优于CNN–LS TM模型,这表明分解输入数据更有利于提高非周期时间序列的预测精度。CEEMDAN方法在每次分解中都添加了自适应白噪声以平滑脉冲干扰,因此数据的分解非常完整[37]. 对于非周期参数,完全分解可以更好地分离数据的噪声分量和周期分量。其中,周期分量的预测效果更好,因此数据序列的预测精度也得到了提高。
增加每一轮预测的预测步骤可能有助于减少计算消耗,而以前的相关研究很少讨论预测步骤的增加对模型性能的影响[14,15]. 在本研究中,对所有模型进行了一步预测(4小时)到六步预测(1天)的测试,旨在分析预测步骤对模型性能的影响。如所示图9图10随着预测步长的增加,所有模型的CE均减小,而RMSE和MAPE则逐渐增大。之前的一些水文数据预测研究也在月尺度上获得了类似的结果。例如,在基于小波分析-神经网络模型的多尺度月地下水位预测研究中,前2个月和前3个月的预测结果比前1个月的结果差[38]. 在使用两阶段混合模型预测英罗峡流域径流的研究中,该模型在较短前置时间(1个月)下的精度优于3个月和6个月的水平[34]. 然而,除了预测精度会随着预测步长的增加而降低的结论外,我们还发现不同水质参数的精度衰减率不同。以指示CE为例,随着预测步长的增加,DO模型的CE衰减率远低于TN模型。基于时间t时的CE(即单步法),计算了时间t+1、t+2、t+3、t+4和t+5时CNN–LSTM和CEEMDAN–CNN–LS模型的CE衰减率,结果显示为图11对于DO,CNN–LSTM模型和CEEMDAN–CNN–LS TM模型的衰减率分别为3.09~9.28和0~4.08。对于TN,CNN–LSTM模型和CEEMDAN–CNN–LS TM模型的衰减率分别为13.16~48.68和2.17~14.13。显然,周期参数DO的衰减率低于非周期参数TN,基于二维输入数据的衰减率也低于一维输入数据。有趣的是,随着预测步骤的增加,预测精度降低。随着河流的不断流动,受到不同影响的水逐渐流经监测站。随着时间间隔的延长,水质差异变大。因此,基于同一组输入数据的预测精度逐渐降低。此外,TN浓度主要受人类活动的影响。TN排放源一直在变化,随着预测步长的增加,可能出现或消失。因此,TN的衰减速度比DO快。

5.结论

在本研究中,比较了使用和不使用CEEMDAN预处理方法的深度神经网络CNN、LSTM和CNN-LSTM在水质参数预测中的性能。收集了2015年至2020年10326条记录的实时水质监测数据集作为输入数据。根据数据的完整性和参数的波动特征,选择DO和TN作为预测目标。首先用CEEMDAN方法对DO和TN数据序列进行分解,得到两个分解后的数据集,其中包含13个IMF和一个残差项。考虑到数据的监测频率(每4小时一次),选择两天内的12条记录作为输入变量,第二天的6条记录作为输出变量。然后,准备一组12×1的数据序列作为原始输入数据,而基于CEEMDAN的输入数据是一组12×14的二维灰色图像。这两种类型的输入数据分别用于训练和测试CNN、LSTM和CNN-LSTM模型。结果表明,混合模型CNN-LSTM的性能优于独立模型CNN和LSTM。该模型使用基于CEEMDAN的二维输入数据,比使用原始输入数据的模型表现要好得多。此外,基于CEEMDAN的数据对非周期参数TN的改进远远大于对周期参数DO的改进。此外,本研究还分析了预测步骤对模型预测精度的影响。结果表明,随着预测步长的增加,模型预测精度逐渐降低。衰减率表现出原始输入数据比基于CEEMDAN的输入数据衰减更快,非周期参数TN比周期参数DO衰减更快的特点。一般来说,通过CEEMDAN方法预处理的输入数据可以有效地提高深度神经网络的预测性能,对于非周期参数,这种改进尤其明显。总的来说,与单独的监测系统相比,合并的监测和建模框架可以提供更好的知识,这可以帮助决策部门应对即将发生的事件和疫情。

作者贡献

概念化,J.S。;数据管理,J.S.和M.Z。;融资收购,X.L。;方法论,X.L。;书面原稿,J.S。;写作审查和编辑,X.L.和Z.-L.W.所有作者均已阅读并同意手稿的出版版本。

基金

本研究由国家自然科学基金41372373号、天津市教委创新团队培养计划TD12-5037、天津市高等教育委员会科学技术发展基金2018KJ160资助。

机构审查委员会声明

不适用。

知情同意书

不适用。

数据可用性声明

限制适用于这些数据的可用性。数据来源于中华人民共和国生态与环境部,网址为http://106.37.208.243:8068/GJZ/Business/Publish/Main.html,于2021年4月21日访问。

致谢

作者感谢中华人民共和国生态环境部和黄山生态环境监测站的数据支持。作者还感谢“国家地理资源科学分中心、国家地球系统科学数据中心、国家科技基础设施”提供的基础背景数据支持(http://gre.geodata.cn)和中国气象数据服务中心(网址:http://data.cma.cn).

利益冲突

作者声明没有利益冲突。

工具书类

  1. 姜杰。;唐,S。;Han,D。;Fu,G。;Solomatine,D。;Zheng,Y.地表水水质监测网设计和优化综合评述。环境。模型。柔和。 2020,132, 104792. [谷歌学者] [交叉参考]
  2. 孙,Y。;陈,Z。;Wu,G。;吴琼。;张,F。;牛,Z。;胡海英:中国城市污水处理厂水质特征:对资源利用和管理的启示。J.清洁。产品。 2016,131, 1–9. [谷歌学者] [交叉参考] [绿色版本]
  3. Fijani,E。;巴泽加,R。;德奥·R。;西里蒂斯,E。;Skordas,K.设计并实现了一种基于两层分解方法的混合模型,该模型与极端学习机相结合,以支持水质参数的实时环境监测。科学。总环境。 2019,648,839–853页。[谷歌学者] [交叉参考]
  4. Chen,K。;陈,H。;周,C。;黄,Y。;齐,X。;沈,R。;刘,F。;左,M。;邹,X。;Wang,J.使用基于大数据的不同机器学习模型对地表水水质预测性能和关键水参数识别进行比较分析。水资源。 2020,171, 115454. [谷歌学者] [交叉参考] [公共医学]
  5. 卢,H。;Ma,X.短期水质预测的基于混合决策树的机器学习模型。化学圈 2020,249,126169。[谷歌学者] [交叉参考] [公共医学]
  6. 布科洛,M。;福图纳,L。;内尔克,M。;A.里佐。;Sciacca,T.制浆造纸厂腐蚀现象预测模型。控制工程实践。 2002,10, 227–237. [谷歌学者]
  7. 李,X。;Sha,J。;李永明。;Wang,Z.-L.森林流域日径流预测混合模型的比较。J.水力信息。 2018,20, 191–205. [谷歌学者] [交叉参考] [绿色版本]
  8. Mohammadi,B。;林,N.T.T。;Pham,Q.B。;艾哈迈德,A.N。;沃伊特科娃,J。;关,Y。;Abba,S。;El-Shafie,A.自适应神经模糊推理系统与混合蛙跳算法相结合,用于预测河流流量时间序列。水文学。科学。J。 2020,65, 1738–1751. [谷歌学者] [交叉参考]
  9. Tabbussum,R。;Dar,A.Q.人工智能范式的性能评估——用于洪水预测的人工神经网络、模糊逻辑和自适应神经模糊推理系统。环境。科学。波卢特。物件。 2021, 1–18. [谷歌学者] [交叉参考]
  10. Raj,R.J.S。;绍巴纳,S.J。;Pustokhina,I.V.公司。;Pustokhin,D.A。;古普塔,D。;Shankar,K.在医疗物联网中使用深度学习模型进行基于最佳特征选择的医学图像分类。IEEE接入 2020,8, 58006–58017. [谷歌学者] [交叉参考]
  11. Jin,Y。;温,B。;顾,Z。;蒋,X。;舒,X。;曾,Z。;Zhang,Y。;郭,Z。;陈,Y。;Zheng,T.深度学习型基于MXene的人工喉咙:面向声音检测和语音识别。高级主管。Technol公司。 2020,5, 2000262. [谷歌学者] [交叉参考]
  12. 王,S。;查,Y。;李伟(Li,W.)。;吴琼。;李,X。;牛,M。;王,M。;邱,X。;李,H。;Yu,H.用于新冠肺炎诊断和预后分析的全自动深度学习系统。欧洲复兴银行。J。 2020,56. [谷歌学者] [交叉参考] [公共医学]
  13. Xiang,Z。;Demir,I.使用深度学习进行分布式长期小时流量预测——爱荷华州的案例研究。环境。模型。柔和。 2020,131, 104761. [谷歌学者] [交叉参考]
  14. 巴泽加,R。;马萨诸塞州阿拉米。;Adamowski,J.使用混合CNN–LSTM深度学习模型进行短期水质变量预测。斯托克。环境。Res.风险评估。 2020,34, 415–433. [谷歌学者] [交叉参考]
  15. An,L。;郝,Y。;Yeh,T.-C.J。;刘,Y。;刘伟。;Zhang,B.结合时间-频率分析方法和长-短期记忆神经网络模拟岩溶泉水流量。J.水文学。 2020,589,125320。[谷歌学者] [交叉参考]
  16. Ni,L。;王,D。;副总裁辛格。;吴杰。;Wang,Y。;Tao,Y。;Zhang,J.通过两个基于长短期记忆的模型进行水流和降雨量预测。J.水文学。 2020,583, 124296. [谷歌学者] [交叉参考]
  17. 刘,G。;He,W。;蔡S.珠江口东南部溶解氧的季节变化。 2020,12, 2475. [谷歌学者] [交叉参考]
  18. 张,X。;Yi,Y。;Yang,Z.不同人类活动强度下半干旱平原盆地的氮磷截留收支。科学。总环境。 2020,703, 134813. [谷歌学者] [交叉参考]
  19. 李,X。;冯,J。;韦伦,C。;Wang,Y.在监测较少的流域中,高受损河段识别和总氮负荷估计的贝叶斯方法。环境。科学。波卢特。物件。 2017,24, 987–996. [谷歌学者] [交叉参考]
  20. 托雷斯,M.E。;科洛米纳斯(Colominas),文学硕士。;施洛特豪尔,G。;Flandrin,P.带自适应噪声的完全集合经验模式分解。2011年IEEE声学、语音和信号处理国际会议(ICASSP)会议记录,2011年5月22日至27日,捷克共和国布拉格;第4144-4147页。[谷歌学者]
  21. 黄,N.E。;沈,Z。;Long,S.R。;吴,M.C。;Shih,H.H。;郑琦。;北卡罗来纳州的Yen。;东,C.C。;Liu,H.H.非线性和非平稳时间序列分析的经验模式分解和希尔伯特谱。程序。R.Soc.伦敦。序列号。数学。物理学。工程科学。 1998,454, 903–995. [谷歌学者] [交叉参考]
  22. 吴,Z。;Huang,N.E.集成经验模式分解:一种噪声辅助数据分析方法。高级自适应。数据分析。 2009,1, 1–41. [谷歌学者] [交叉参考]
  23. Rahimpour,A。;Amanollahi,J。;Tzanis,C.G.基于城市环境机器学习方法的空气质量数据系列估计。空气质量。大气。健康 2021,14, 191–201. [谷歌学者] [交叉参考]
  24. Yeh,J.-R。;谢赫,J.-S。;Huang,N.E.互补系综经验模式分解:一种新的噪声增强数据分析方法。高级自适应。数据分析。 2010,2,135–156。[谷歌学者] [交叉参考]
  25. 哈博拉,S。;Coors,V.风预测的一维卷积神经网络结构。能量转换。管理。 2019,195,70–75。[谷歌学者] [交叉参考]
  26. 王海珠。;李国庆。;王,G.-B。;彭建忠。;姜浩。;Liu,Y.-T.基于深度学习的概率风电预测集成方法。申请。能源 2017,188, 56–70. [谷歌学者] [交叉参考]
  27. 苗,Q。;潘,B。;王,H。;许,K。;Sorooshian,S.使用卷积和长短期记忆神经网络改进季风降水预测。 2019,11, 977. [谷歌学者] [交叉参考] [绿色版本]
  28. 辛顿,G.E。;北斯利瓦斯塔瓦。;Krizhevsky,A。;Sutskever,I。;Salakhutdinov,R.R.通过防止特征检测器的联合自适应来改进神经网络。arXiv公司 2012,arXiv:1207.0580。[谷歌学者]
  29. 洛夫,S。;Szegedy,C.批处理规范化:通过减少内部协变量偏移来加速深层网络训练。arXiv公司 2015,arXiv:1502.03167。[谷歌学者]
  30. 王凯。;齐,X。;Liu,H.基于深度学习神经网络的日间光伏功率预测模型的比较。申请。能源 2019,251, 113315. [谷歌学者] [交叉参考]
  31. LeCun,Y。;Y.本吉奥。;Hinton,G.深度学习。自然 2015,521, 436–444. [谷歌学者] [交叉参考]
  32. 牛,H。;Xu,K。;Wang,W.基于变分模式分解和LSTM网络的混合股价指数预测模型。申请。因特尔。 2020,50, 4296–4309. [谷歌学者] [交叉参考]
  33. Al-Musaylh,医学硕士。;德奥,R.C。;李毅。;Adamowski,J.F.两阶段粒子群优化支持向量回归混合模型,结合改进的经验模式分解和自适应噪声,用于多时段电力需求预测。申请。能源 2018,217, 422–439. [谷歌学者] [交叉参考]
  34. 温,X。;冯,Q。;德奥,R.C。;吴,M。;尹,Z。;Yang,L。;Singh,V.P.两阶段极值学习机与完整的集成经验模式分解和自适应噪声算法相结合,用于多尺度径流预测问题。J.水文学。 2019,570, 167–184. [谷歌学者] [交叉参考]
  35. 莫里亚西,D.N。;阿诺德,J.G。;Van Liew,M.W。;宾纳,R.L。;R.D.哈梅尔。;Veith,T.L.流域模拟准确性系统量化模型评估指南。事务处理。ASABE公司 2007,50, 885–900. [谷歌学者] [交叉参考]
  36. 于,Z。;Yang,K。;罗,Y。;Shang,C.基于小波分析和长短期记忆网络的滇池叶绿素a浓度时空过程模拟和预测。J.水文学。 2020,582, 124488. [谷歌学者] [交叉参考]
  37. 戴,S。;牛,D。;Li,Y.基于自适应噪声的完全集成经验模式分解和改进的灰狼优化算法优化的支持向量机的日峰值负荷预测。能源 2018,11, 163. [谷歌学者] [交叉参考] [绿色版本]
  38. 温,X。;冯,Q。;德奥,R.C。;吴,M。;Si,J.小波分析——中国西北部干旱内陆河流域多尺度月地下水位预测的人工神经网络连接模型。水文学。物件。 2017,48,1710年至1729年。[谷歌学者] [交叉参考]
图1。街口监测站的位置。
图1。街口监测站的位置。
水13 01547 g001
图2。本研究中的数据划分标准。
图2。本研究中的数据划分标准。
水13 01547 g002
图3。长短期记忆(LSTM)神经网络的结构。
图3。长短期记忆(LSTM)神经网络的结构。
水13 01547 g003
图4。本研究中使用的两种输入数据。
图4。本研究中使用的两种输入数据。
水13 01547 g004
图5。原始DO时间序列、IMF和CEEMDAN方法分解的残差分量。
图5。原始DO时间序列、IMF和CEEMDAN方法分解的残差分量。
水13 01547 g005
图6。DO测试数据10%最低值和10%最高值的观察值和预测值之间的MAPE:()基于原始输入数据,从步骤1到步骤6的最低值的MAPE(b条)基于原始输入数据的第1步至第6步峰值的MAPE(c(c))基于CEEMDAN输入数据的步骤1至6中最低值的MAPE,以及(d日)根据CEEMDAN输入数据,计算步骤1至6的峰值MAPE。
图6。DO测试数据10%最低值和10%最高值的观察值和预测值之间的MAPE:()基于原始输入数据,从步骤1到步骤6的最低值的MAPE(b条)基于原始输入数据的第1步至第6步峰值的MAPE(c(c))基于CEEMDAN输入数据的步骤1至6中最低值的MAPE,以及(d日)根据CEEMDAN输入数据,计算步骤1至6的峰值MAPE。
水13 01547 g006
图7。原始TN时间序列、IMF和CEEMDAN方法分解的残差分量。
图7。原始TN时间序列,以及通过CEEMDAN方法分解的IMF和残差分量。
水13 01547 g007
图8。TN测试数据的10%最低值和10%最高值的观测值和预测值之间的MAPE:()基于原始输入数据,第1步到第6步中最低值的MAPE(b条)基于原始输入数据的第1步至第6步峰值的MAPE(c(c))基于CEEMDAN输入数据的步骤1至步骤6中最低值的MAPE(d日)根据CEEMDAN输入数据,计算步骤1至6的峰值MAPE。
图8。TN测试数据10%最低值和10%最高值的观察值和预测值之间的MAPE:()基于原始输入数据,第1步到第6步中最低值的MAPE(b条)基于原始输入数据的第1步至第6步峰值的MAPE(c(c))基于CEEMDAN输入数据的步骤1至6的最低值的MAPE(d日)根据CEEMDAN输入数据,计算步骤1至6的峰值MAPE。
水13 01547 g008
图9。不同模型的DO性能随预测步骤的增加而变化:()CE、(b条)RMSE。
图9。不同模型的DO性能随预测步骤的增加而变化:()CE、(b条)RMSE。
水13 01547 g009
图10。随着预测步骤的增加,不同模型的TN性能变化:()CE、(b条)RMSE。
图10。随着预测步骤的增加,不同模型的TN性能变化:()CE、(b条)RMSE。
水13 01547 g010
图11。对于DO和TN,CNN–LSTM和CEEMDAN–CNN–LSTM模型从步骤1到步骤6的CE衰减率。
图11。对于DO和TN,CNN–LSTM和CEEMDAN–CNN–LSTM模型从步骤1到步骤6的CE衰减率。
水13 01547 g011
表1。DO和TN培训、验证和测试数据集的描述性统计。
表1。DO和TN培训、验证和测试数据集的描述性统计。
描述性统计单位执行TN公司
T型1V(V)2T型T型1V(V)2T型
最小值。毫克/升4.125.73.950.180.080.16
平均值毫克/升9.138.58.181.41.241.24
中值的毫克/升8.878.398.151.381.151.26
最大值。毫克/升18.8514.1412.422.823.94.24
标准偏差毫克/升1.791.691.910.370.420.37
偏斜(Skewness)无量纲的0.410.49−0.20.20.4780.85
峭度无量纲的0.27−0.25−0.80.120.610.36
1培训数据集。2正在验证数据集。测试数据集。
表2。DO预测模型的输入矩阵。
表2。DO预测模型的输入矩阵。
目标输入1输入2输入3输入11输入12
执行t吨执行t−1执行t−2执行t−3执行t−11执行t−12
执行t+1(电话+1)执行t−1执行t−2执行t−3执行t−11执行t−12
执行t+2天执行t−1执行t−2执行t−3执行t−11执行t−12
执行t+3天执行t−1执行t−2执行t−3执行t−11执行t−12
执行电话+4执行t−1执行t−2执行t−3执行t−11吨执行t−12
执行t+5分执行t−1执行t−2型执行t−3执行t−11执行t−12
表3。DO数据集测试期间,CNN、LSTM、CNN–LSTM、CEEMDAN–CNN、CEEMDAN–LSTM和CEEMDAN–CNN–LS TM的性能统计。
表3。DO数据集测试期间,CNN、LSTM、CNN–LSTM、CEEMDAN–CNN、CEEMDAN–LSTM和CEEMDAN–CNN–LS TM的性能统计。
目标模型总工程师RMSE公司MAPE公司
执行t吨美国有线电视新闻网0.950.414.17
LSTM公司0.950.434.29
美国有线电视新闻网-LSTM0.970.353.06
加拿大中央电视台0.970.344.02
CEEMDAN–LSTM公司0.970.333.23
CEEMDAN–CNN–LSTM0.980.262.55
执行t+1(电话+1)美国有线电视新闻网0.930.504.68
LSTM公司0.920.545.13
美国有线电视新闻网-LSTM0.940.464.06
CEEMDAN–美国有线电视新闻网0.960.404.92
CEEMDAN–LSTM公司0.950.424.32
CEEMDAN–CNN–LSTM0.980.282.79
执行t+2天美国有线电视新闻网0.900.596.03
LSTM公司0.900.605.68
美国有线电视新闻网-LSTM0.920.534.65
CEEMDAN–美国有线电视新闻网0.950.445.37
CEEMDAN–LSTM公司0.950.444.62
CEEMDAN–CNN–LSTM0.970.313
执行t+3天美国有线电视新闻网0.900.626.21
LSTM公司0.890.635.87
美国有线电视新闻网-LSTM0.910.585.14
CEEMDAN–美国有线电视新闻网0.920.546.66
CEEMDAN–LSTM公司0.930.515.24
CEEMDAN–CNN–LSTM0.970.343.30
执行电话+4美国有线电视新闻网0.890.646.34
LSTM公司0.880.655.94
美国有线电视新闻网-LSTM0.900.625.42
CEEMDAN–美国有线电视新闻网0.910.577.02
CEEMDAN–LSTM公司0.920.545.76
CEEMDAN–CNN–LSTM0.960.393.65
执行t+5分美国有线电视新闻网0.870.706.96
LSTM公司0.870.685.96
CNN–LSTM公司0.880.655.67
CEEMDAN–美国有线电视新闻网0.880.678.38
CEEMDAN–LSTM公司0.910.576.24
CEEMDAN–CNN–LSTM0.940.484.56
表4。TN数据集测试期间CNN、LSTM、CNN–LSTM、CEEMDAN–CNN、CEEMDAN–LSTM和CEEMDAN–CNN–LS TM的性能统计。
表4。TN数据集测试期间CNN、LSTM、CNN–LSTM、CEEMDAN–CNN、CEEMDAN–LSTM和CEEMDAN–CNN–LS TM的性能统计。
目标模型总工程师RMSE公司MAPE公司
TN公司t吨美国有线电视新闻网0.720.1910.79
LSTM公司0.740.1911.21
美国有线电视新闻网-LSTM0.760.1810.06
CEEMDAN–美国有线电视新闻网0.910.116.68
CEEMDAN–LSTM公司0.910.117.41
CEEMDAN–CNN–LSTM0.920.106.63
TN公司t+1(电话+1)美国有线电视新闻网0.630.2312.71
LSTM公司0.650.2212.86
美国有线电视新闻网-LSTM0.660.2211.86
CEEMDAN–美国有线电视新闻网0.870.137.95
CEEMDAN–LSTM公司0.880.138.64
CEEMDAN–CNN–LSTM0.900.127.71
TN公司t+2天美国有线电视新闻网0.550.2513.48
LSTM公司0.560.2414.01
美国有线电视新闻网-LSTM0.570.2413.07
CEEMDAN–美国有线电视新闻网0.830.1510.27
CEEMDAN–LSTM公司0.850.149.65
CEEMDAN–CNN–LSTM0.870.138.71
TN公司t+3天美国有线电视新闻网0.470.2714.37
LSTM公司0.500.2615.18
美国有线电视新闻网-LSTM0.500.2613.75
加拿大中央电视台0.810.1610.88
CEEMDAN–LSTM公司0.820.1610.03
CEEMDAN–CNN–LSTM0.840.159.12
TN公司t+4美国有线电视新闻网0.410.2815.24
LSTM公司0.430.2815.95
美国有线电视新闻网-LSTM0.440.2814.61
CEEMDAN–美国有线电视新闻网0.790.1710.68
CEEMDAN–LSTM公司0.790.1710.66
CEEMDAN–CNN–LSTM0.810.169.37
TN公司t+5分美国有线电视新闻网0.340.3015.86
LSTM公司0.380.2916.60
美国有线电视新闻网-LSTM0.390.2915.41
CEEMDAN–美国有线电视新闻网0.780.1710.55
CEEMDAN–LSTM公司0.780.1711.13
CEEMDAN–CNN–LSTM0.790.179.91
出版商备注:MDPI对公布的地图和机构关联中的管辖权主张保持中立。

分享和引用

MDPI和ACS样式

Sha,J。;李,X。;张,M。;王,Z.-L。基于混合深度学习神经网络的水质参数实时监测预测模型比较。 2021,13, 1547.https://doi.org/10.3390/w13111547

AMA风格

Sha J、Li X、Zhang M、Wang Z-L。基于混合深度学习神经网络的水质参数实时监测预测模型比较。. 2021; 13(11):1547.https://doi.org/10.3390/w13111547

芝加哥/图拉宾风格

Sha、Jian、Xue Li、Man Zhang和Zhong-Liang Wang。2021.“基于混合深度学习神经网络的水质参数实时监测预测模型比较”13,11号:1547。https://doi.org/10.3390/w13111547

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章指标

返回页首顶部