杂志的下一篇文章
通过增加压电石英晶体(PQC)的电极面积提高数字电极-压电石英水晶(IDE-PQC)盐浓度传感器的性能
期刊上的上一篇文章
基于遗传算法优化的支持向量机在近红外光谱传感器数据分析中的应用
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
Aa公司 Aa公司 Aa公司
行距:
列宽:
背景:
第条

指数平滑法短期PM2.5预测的比较分析

通过
萨奇特·马哈扬
1,2,3,*,
Ling-Jyh Chen先生
1
蔡子恺
1
台湾115台北市南岗区中央研究院信息科学研究所
2
社会网络与人本计算,台湾国际研究生项目,中国科学院,台北市南岗区115
台湾台北市文山区国立政治大学计算机科学系116
*
信件应寄给的作者。
传感器 2018,18(10), 3223;https://doi.org/10.3390/s18103223
收到的提交文件:2018年8月15日/修订日期:2018年9月4日/接受日期:2018年9月18日/发布日期:2018年9月25日
(本条属于本节物联网)

摘要

:
空气污染是一个全球性问题,可以被视为现代的祸根。解决这一问题的方法之一是找到经济的方法来监测和预测空气质量。准确监测和预测细颗粒物(PM2.5)浓度是一项具有挑战性的预测任务,但物联网(IoT)可以帮助开发经济、灵活的方法来设计此类系统。在本文中,我们使用基于历史数据的方法进行PM2.5预测。提出了一种使用带漂移指数平滑的预测方法。利用台湾台中地区大规模部署物联网设备获得的实时PM2.5数据进行了实验和评估。我们使用了132个监测站的数据来评估模型的性能。比较了该模型与三种常用预测模型的预测精度和计算时间。结果表明,该方法可以对132个监测站进行PM2.5预测,误差低至0.16 μ 克/ 并且可接受的计算时间为30s。通过预测未来3h的PM2.5进行进一步评估。结果表明,90%的监测站的误差在1.5以下 μ 克/ 这是非常低的。

1.简介

随着城市化和工业的快速发展,人们对空气质量恶化的担忧也在增加。空气质量的恶化对生活质量产生了不利影响,甚至对经济增长产生了负面影响。虽然解决这个问题还有很多工作要做,但物联网技术带来了一线希望。其想法是使用物联网设备和认知计算生成大量数据,这些数据可以进一步用于加强空气质量管理系统和预测。典型情况包括收集和存储从传感器获得的数据、数据分析、预测、可视化以及在空气质量异常情况下的警报消息服务。当谈到智能城市倡议时,其中一个重要部分包括开发一个系统,不仅可以监测空气质量,还可以提供未来预测。在所有污染物中,PM2.5(直径小于2.5微米的细颗粒物)被认为对人类非常有害。这些微粒导致严重的呼吸道疾病、哮喘和肺癌[1]因为它们可以穿透肺泡(肺部气体交换的区域)。
以前的一些研究工作已经表明参与式感知如何用于事件检测[2]. 此外,无线传感器网络可以有效地实现对环境的实时监测[]. 然而,准确预测空气质量是一项非常具有挑战性的任务。影响城市空气质量的因素很多,例如气象因素和交通密度[4]. 由于这些因素的性质,很难获得足够准确的数据来完成任务。重要的是开发空气质量预测系统,该系统能够以有限的参数进行准确的预测。这方面的大多数工作都依赖于数学模型。运行模拟进行预测[5]. 人们提出了许多空气质量管理(AQM)方法。这些可以分为以下几类:基于经验模型的预测、基于模糊逻辑的建模、基于仿真和基于统计模型[6]. 建立空气污染物监测系统对于有效监测空气质量的变化以及评估空气污染对人类健康和城市可持续性的有害影响至关重要。一些作品[7,8]讨论室内外场所的空气质量监测。另一种方法是使用空气质量建模软件。使用此类模型的缺点是,它们没有考虑所有可能影响空气质量的因素。目前,有一些组织拥有监测和了解空气质量的平台(https://www.londonair.org.uk/londonair/Default.aspx网站). 他们大多遵循传统的方法,收集数据、分析并再次重复整个过程。必须认识到,数据收集总是有成本的,复制数据是一项繁琐的工作。这使得拥有一个经济高效且可靠的系统变得非常重要。我们的方法是以数据为中心的。我们使用了从台湾大规模物联网部署中获得的PM2.5数据[9]. 我们使用实时数据进行了实验和评估。
本文的贡献有四个方面:
  • 开发了一个单变量时间序列预测模型,该模型使用带漂移的指数平滑进行预测。
  • 使用从台湾部署的监测设备获得的真实数据,该模型用于每小时PM2.5预测。
  • 我们通过使用监测站的数据将结果与三个基线模型进行比较,从而评估了我们的模型的性能。评估基于准确性和计算时间。对该模型进行了进一步测试,以预测未来三小时的PM2.5。
  • 通过对台湾台中地区部署的132个空气质量监测节点进行预测,验证了该模型的可扩展性。
论文的其余部分组织如下。第2节,我们讨论了相关工作以及我们在这项研究背后的动机。第3节,我们描述了系统概述,其中包括拟议的体系结构、Airbox项目和部署。我们还讨论了Airbox数据和可视化平台。第4节,我们详细解释了所提出的模型,并讨论了其他基线模型。第5节,我们在实时数据上实现了该模型并观察了结果。第6节,我们通过将该模型的结果与其他基线模型进行比较来评估我们的模型。第7节对论文进行了总结,并对未来可能的工作进行了简要描述。

2.相关工作和激励

通过利用现代技术,我们做出了很大努力,开发了能够为用户提供实时信息和服务的系统。有几项工作与空气质量监测和为用户提供服务有关。Grover等人[10]提出了一种用于天气预报的深度混合模型。它不预测PM2.5,但预测温度、风和露点等变量。线性回归技术已广泛用于预测和分析,包括与金融领域相关的数据[11],这是快速变化的气象、环境数据[12]然而,由于空气质量数据的复杂性,它并没有在该领域得到广泛应用。Zheng等人[4]使用数据驱动方法对未来48小时进行预测。他们使用了基于线性回归模型和神经网络的预测模型[13]提出大数据可以使城市实时分析、城市治理,并可以作为发展智慧可持续城市的有效工具。在许多情况下,时间序列数据可能会有噪声,并且使用非平稳数据进行预测并不容易。Ghazali等人[14]使用动态岭多项式神经网络进行金融时间序列预测,使用高阶和递归神经网络。Hsieh等人[15]重点关注使用稀疏监测站的数据对某一地区进行空气质量预测等问题。Khan等人[16]调查了云平台在大数据分析中的使用。他们展示了如何通过使用存储在云平台中的实时大数据来实现智能城市倡议。然而,这些技术的漏洞在于它们仅仅依赖于向模型提供各种特性。这些特征属于一个特定位置,所有位置都使用类似的模型。问题是每个地方都有不同的排放源、污染物和浓度;因此,一个模型无法对所有位置进行准确预测。Donnelly等人[17]提出了一种基于线性回归的高精度实时空气质量预测方法。然后对三个城市站点和一个农村站点测试该模型。在我们的工作中,我们制作了一个可扩展的模型,为了测试我们系统的可扩展性,我们将其应用于132个监测站。Zheng等人[18]实施机器学习技术和大数据来执行城市计算。为了避免计算过于复杂,Zhu等人[19]在进行预测之前对空气污染进行分类。然而,这样可能会失去时间序列预测的意义。虽然机器学习模型已经被广泛提出,但当涉及到小时间间隔的PM2.5预测时,它还没有得到太多的利用。机器学习技术有时存在计算效率问题。为了解决这个问题,Shi等人[20]和Chen等人[21]使用了Xgboost,它实现了读头缓存并利用并行计算来减少执行时间。然而,这可能会导致预测模型的准确性下降。
人类总是被感知设备包围着,这些设备在物理世界和虚拟世界之间创造了一种融合。换句话说,我们可以将其称为人联网(IoH),它是物联网(IoT)和以人为中心的计算(HCC)的结合。定期的空气质量监测和分析有助于提高社区对环境问题的认识。在这项工作中,我们将网络传感和众包技术相结合,收集有关周围环境的传感数据流,并在个人、社会和城市层面提供有见地的信息服务。我们开展这项工作的动机是集成物联网和机器学习技术,并开发一个系统,该系统不仅向用户提供实时空气质量信息,还让人们意识到与空气质量差有关的问题。在这项工作中,我们处理了从部署在台湾各地的物联网设备中获得的大量PM2.5数据。因此,确保数据具有最高质量并检测到数据中的任何异常变得非常困难。此外,实现较高的预测精度并确保计算时间较短也很重要,以便可以使用该模型创建实时应用程序。

3.系统概述

3.1. 拟议系统架构

建议的系统如所示图1它遵循三种方法,包括数据感知、数据挖掘和提供服务。数据来自部署在台湾各地的PM2.5传感装置。物联网设备提供不同地区的实时PM2.5数据、温度和湿度水平。数据收集是一个连续的过程,该过程中的任何异常都会直接报告给管理员[22]. 收集的数据存储在数据库中,并且易于访问。有时,一些监测站没有显示任何读数。数据监控组件通过过滤此类数据并根据空间和时间相邻设备填充缺失的值来进行处理。预测模型使用带漂移的指数平滑来预测每小时PM2.5。预测数据可以存储并作为web服务与数据可视化一起提供。

3.2. Airbox项目

Airbox项目包括在台湾各地试点部署用于PM2.5监测的物联网系统。本项目的主要动机是鼓励人们参与PM2.5检测。该项目的主要灵感来自LASS(位置感知系统)社区。该社区鼓励人们参与PM2.5传感,并鼓励他们自己尝试和开发传感设备。该项目有助于以更精细的时空粒度进行PM2.5监测,并通过确保所有测量数据均可免费提供给每个人来丰富数据分析[9]. 这些设备安装在具有可靠互联网连接和电源的建筑物中。此外,数据(https://pm25.lass-net.org/en/)易于访问,这使得数据分析更容易。Airbox项目中的传感设备由专业制造商设计和开发。工业产品级设备是与台湾的Edimax Inc.和Realtek Inc.密切合作制造的。这些设备基于Realtek Ameba开发板。该装置包含一个PMS5003 PM2.5传感器和一个HTS221温度/湿度传感器。另一种部署设备被称为MAPS(微空气污染传感系统),由台湾中央研究院信息科学研究所网络研究实验室开发。它基于MediaTek LinkIt Smart 7688 Duo开发板。它有一个PMS5003传感器用于PM2.5,BME 280用于温度/湿度。框架的数据感知部分如所示图2。传感系统有三个主要组件。
  • 数据生产者包括提供感测数据的传感器。硬件和源代码都是开源的,因此人们可以自己创建这样的设备。
  • 运输中心充当从数据生产者发送给数据用户的数据的数据代理。可以使用多个数据代理实现可扩展性和容错性。
  • 数据用户是那些使用感测数据、分析数据并创建不同类型应用程序的人。
对于数据通信,传感框架使用消息队列遥测传输(MQTT)协议[23]. 使用MQTT是因为它具有较低的通信开销、简单的设计和适应不同消息格式的灵活性。Airbox设备的数据采样频率估计为每5分钟一次。然而,据观察,几乎80%的设备的采样间隔时间为6分钟,其余设备的采样时间约为12分钟。空气箱设备的样品采集之间有一个待机时间,发现该时间为5分钟,采样大约需要1分钟。这使得采样间隔时间为6分钟。如果出现错误,第一次数据测量将失败。在这种情况下,采样间隔时间增加到12分钟。对于本研究,我们将数据转换为小时数据。在继续进行实验之前,对PM2.5数据进行了缺失数据检查。图3显示了基于2016年11月数据的PM2.5变化。可以在中观察到图3PM2.5的变化有时有趋势。例如,在周末,可以假设大多数人都会外出,这意味着更多的交通和更多的污染物。因此,周末PM2.5将高于平日。同样,在早上和傍晚,由于人们通勤,PM2.5会更高。这种趋势很容易观察到。图4可以观察到,不同站点的PM2.5小时浓度显示出不同的水平。可以看到不同站点在不同时间段的变化。图中的峰值可以称为拐点,即PM2.5浓度水平急剧变化的点。拐点可视为PM2.5值的突然增加,这可能是由环境因素或人类活动引起的。在这些点上,PM2.5浓度水平急剧变化。这些变化并不代表特定地点的常规空气质量模式,而是由于雷雨或强风可能发生的事件。由于这些事件很少发生,因此很难使用常规预测模型对其进行建模。

3.3. 数据存档和开放数据API

已经设置了一个数据存档服务,用于存储和提供来自监控设备的所有记录。拥有这样的系统是非常有益的,因为这样的服务可以确保基于我们部署的所有PM2.5观测结果都可以很容易地访问和跟踪。此外,它还帮助我们维护一个持久的数据存档,其中包含用于进一步分析和建模的验证数据。该系统的另一个重要特点是可以从台湾其他开放的本地数据源导入PM2.5测量数据。这实际上有助于提高覆盖范围并获得越来越多的数据。通过开放数据API(JSON数据格式),人们可以访问特定AirBox设备的最新测量数据,从而在任何特定日期为任何设备生成数千个数据。

3.4. 空箱数据可视化平台

已经开发了可视化平台来可视化Airbox数据。其中之一是一个可视化系统,可以提供有关每个Airbox设备的信息。这些服务有助于了解时空因素对PM2.5测量的影响。已设置仪表板,有助于在一段时间内可视化设备数据。仪表板显示PM2.5、温度和相对湿度,如所示图5a.还开发了Voronoi图和实时PM2.5监测可视化,每5分钟更新一次,如所示图5b、 c.Voronoi图表示根据到特定子集的距离将平面划分为多个区域。在我们的例子中,这就是传感器的位置。开发了一个动画应用程序,以IDW(反向距离权重)动画的形式显示过去24小时的空气质量。该动画适用于整个台湾以及包括台北、桃园、台中和台南在内的所有主要地区。动画每1小时更新一次。在许多情况下,空气质量会发生突然变化。这些动画有助于理解空气污染的趋势。对于重大空气污染事件,结果定期在网上共享,决策机构也可以使用这些结果来分析趋势。图6给出了IDW动画如何帮助理解空气污染扩散趋势的示例。可以观察到,在初始帧中,PM2.5水平是正常的。如第二幅图所示,台湾北部的空气质量开始恶化。很快,它覆盖了整个北部地区,并开始向台湾西北部扩散。它进一步向台湾中部和南部扩散,可以观察到污染物强度随时间而降低。

4.方法

在本节中,我们详细讨论了预测模型的框架。我们还讨论了用于进行比较分析的其他三个基线模型。用于执行分析的模型是一些最广泛使用的时间序列预测模型:自回归综合移动平均(ARIMA)、神经网络自回归模型(NNAR)和混合模型[24].

4.1. 指数平滑漂移(ESD)模型预测方法

图7显示了建议的ESD建模和预测框架。建议的方法基于Theta方法[25]. 使用这种方法进行预测的想法是,当考虑短期PM2.5时,我们假设没有季节性或趋势。该方法使用过去数据的加权移动平均值作为执行预测的基础。θ线可以描述为
2 Z轴 t吨 ( θ ) = θ 2 Y(Y) t吨 , t吨 = , , n个 ,
哪里 Y(Y) 1 …, Y(Y) n个 表示非季节性原始时间序列,而表示差分算子。 Z轴 1 Z轴 2 可以通过最小化来获得 t吨 = 1 n个 [ Y(Y) t吨 Z轴 t吨 ( θ ) ] 2 .中提出的另一种分析解决方案[26]. 它是由
Z轴 t吨 ( θ ) = θ Y(Y) t吨 + ( 1 θ ) ( n个 + B类 n个 t吨 ) , t吨 = 1 , , n个 ,
在方程式中(2), n个 B类 n个 表示线性回归的最小平方系数 Y(Y) 1 , Y(Y) 2 , …, Y(Y) n个 对1n个线性回归表示为
n个 = 1 n个 t吨 = 1 n个 Y(Y) t吨 n个 + 1 2 B类 n个
B类 n个 = 6 n个 2 1 ( 2 n个 t吨 = 1 n个 t吨 Y(Y) t吨 1 + n个 n个 t吨 = 1 n个 Y(Y) t吨 )
基于这些,可以推断出θ线可以被视为线性回归模型直接应用于数据的函数。
Theta方法可以简化为简单的指数平滑,漂移项等于数据拟合直线斜率的一半[26]. 简单来说,ESD模型可以解释为:
t吨 = t吨 1 + b条 + α ε t吨
X(X) t吨 ^ ( 小时 ) = t吨 + 小时 b条
在上述方程式中,表示级别和b条代表漂移。这个小时步进预测表示为 X(X) t吨 ^ ( 小时 ) . α 是平滑参数,其值始终介于0和1之间。加权平均数用于计算预测。权重呈指数下降,这由参数控制 α . ε t吨 表示一步预测误差t吨在样本中。

4.2. 用于比较的基准模型

在本节中,我们将讨论用于进行比较分析的模型。

4.2.1. 自回归综合移动平均(ARIMA)模型

ARIMA模型被视为稳健模型[27]当涉及到时间序列预测时。在预测过程中,首先识别模型,估计参数,然后进行诊断检查。ARIMA公司(第页,d日,q个)模型包括第页,d日q个它们是整数。它们应大于或等于零,并指向模型的自回归(AR)、积分(I)和移动平均(MA)分量的顺序[27]. 让我们考虑一个时间序列 Z轴 t吨 ,其中t吨是一个整数,并且 Z轴 t吨 表示与给定时间的值相对应的实数t吨ARIMA公司(第页,d日,q个)模型可以用以下等式表示。
( 1 B类 ) d日 ( 1 = 1 第页 ϕ B类 ) Z轴 t吨 = ( 1 + = 1 第页 θ B类 ) ε t吨
在方程式中(7), B类 表示倒档操作员,以及 ϕ θ 是自回归和运动部件参数。 ε t吨 是错误术语。如果d日=0,则成为ARMA模型[28].

4.2.2. 神经网络自回归(NNAR)模型

最近,人工神经网络(ANN)在时间序列预测方面得到了广泛的应用。人工神经网络可以用来对输入和输出变量之间的复杂关系进行建模。当我们讨论NNAR模型时,输入是滞后时间序列,输出是时间序列的预测值,表示为NNAR(第页,P(P),k)。在模型中,第页P(P)指出滞后的季节性和非季节性投入,而k表示隐藏层节点的数量。表示季节性。该模型有两个功能。一个是线性组合函数,另一个是激活函数。线性组合函数表示为
Z轴 t吨 = b条 + = 1 n个 w个 , t吨 t吨
哪里 w个 , t吨 表示权重函数,b条表示偏差和 t吨 是滞后的时间序列值。权重最初是随机选择的,稍后可以使用“学习算法”进行更新[29]使成本函数最小化。激活函数可以表示为
(f) ( Z轴 t吨 ) = 1 / ( 1 + e(电子) Z轴 t吨 )
在这项工作中,我们考虑了一种基于非线性自回归模型的前馈神经网络用于时间序列预测。

4.2.3. 混合模型

时间序列可以很容易地分为线性和非线性分量。ARIMA模型提供了良好的预测,但它无法捕捉非线性成分。这使得拥有一种能够捕捉非线性分量的技术变得非常重要。这时我们可以使用ANN。他们可以处理数据的非线性组件。图8显示了模型的流程图。我们使用了一个混合模型[24]用等式表示(10)其中 X(X) t吨 表示线性分量和 Y(Y) t吨 表示非线性分量。
Z轴 t吨 = X(X) t吨 + Y(Y) t吨
在初始步骤中,必须根据数据估计这两个分量。然后,下一阶段是ARIMA模型的应用。在此阶段,ARIMA模型考虑了线性分量,并生成了以非线性分量形式表示的残差。让我们假设 R(右) t吨 是当时产生的残差吗t吨从线性模型。因此,它可以写成
R(右) t吨 = Z轴 t吨 F类 t吨
哪里 F类 t吨 是时间的预测值t吨然后使用神经网络对这些残差进行建模。如果我们假设n个输入节点,则残差的神经网络模型可以如下所示
R(右) t吨 = (f) ( R(右) t吨 1 , R(右) t吨 2 , , R(右) t吨 n个 ) + e(电子)
神经网络定义非线性函数(f)、和e(电子)是生成的随机误差。最后,生成神经网络的预测,方程(10)用于获取最终输出。我们使用了ARIMA(3,1,1)模型,其中3,1.1是第页,d日q个分别是。对于神经网络,我们使用NNAR(9,5,1)模型,该模型使用九个滞后输入,隐藏层中有五个节点。在测试不同的组合并选择输出最佳的组合后,选择了ARIMA和NNAR模型的参数。对于混合模型,我们对ARIMA和NNAR模型的预测结果分配了相等的权重。

5.结果

在本研究中,测量数据是从台湾台中地区安装的空气箱设备中收集的。测量数据取自2017年1月18日至2017年2月12日期间。大多数Airbox设备都安装在该地区的小学,有定期的电源连接和互联网供应。这使得数据非常可靠,质量更好。因此,为了使预测准确,我们只考虑数据可靠的台站。为了测试该模型,我们考虑了从部署在台湾的监测站获得的每小时PM2.5数据。80%的数据用于培训,20%用于测试模型。以平均绝对误差(MAE)和计算时间为参数对结果进行分析。
如果 是实际值 ^ 是预测值,则MAE可以表示为
MAE公司 = 1 / n个 = 1 n个 | ^ |
为了检查我们的模型是如何进行预测的,我们对132个监测节点进行了每小时预测。监控节点的地理位置如所示图9.图10显示了PM2.5观测值和预测值之间的比较图。可以观察到,预测结果与原始观测结果非常接近。这为模型在大规模实现时的可伸缩性提供了思路。

6.评估

为了进行评估,我们遵循了两个步骤。在第一步中,我们将我们的模型与其他基线模型进行了比较,以了解我们的模型在与其他模型进行比较时的表现。使用的参数是平均误差和计算时间。在第二步中,我们对未来3小时的PM2.5进行了预测,以了解该模型如何处理短期PM2.5预测。

6.1. 通过与基线模型进行比较分析进行评估

在这一部分中,我们将提出的模型的结果与三个基线模型进行了比较。为了进行比较,我们使用了ARIMA模型、NNAR模型和混合模型。这些模型是非常著名的时间序列数据预测模型。从所有四个模型的比较分析来看,如表1可以看出,ESD模型优于其他三个模型。获得的平均误差为0.16 μ 克/ 与其他基线模型相比,这是显著低的。在这里,我们还想关注时间-准确性权衡,这可以在图11。当谈到实时应用程序时,我们不仅关注低计算时间,还关注高精度。ESD模型满足这两个条件,即高精度和低计算时间。
图12显示了所有四个模型的累积分布函数(CDF)图。从图中可以看出,ESD模型在未来一小时的预测中优于其他三个模型。大约95%的监测站显示预测误差低于1 μ 克/ 只有NNAR和Hybrid模型的性能接近ESD模型的性能。然而,必须考虑到ESD模型计算的最大误差约为4 μ 克/ ,而混合动力车型大约为10 μ 克/ 而NNAR模型大约为19 μ 克/ .

6.2. 使用ESD模型预测未来3小时PM2.5

根据一小时预测的结果,我们能够理解,即使在大量监测站上实施该系统,该系统也能很好地工作。为了进一步评估我们的模型,我们对所有监测节点进行了未来三个小时的PM2.5预测。根据中所示的CDF图图13可以看出,大多数台站的预测误差都很低。几乎90%的电台误差小于1.5 μ 克/ 适用于所有情况。通过这些结果,我们可以证明该模型可以实现高精度的PM2.5短期预测。

7.结论和未来工作

由于空气污染继续影响生活质量,需要有一个框架,不仅可以监测空气质量,还可以进行数据分析、空气质量预测和提供可视化服务。为了确保人们提前很好地了解未来的空气质量,建立一个准确的预报系统是很重要的。本文将物联网技术与人工智能相结合,提出了PM2.5预测系统。我们设计了一个使用指数平滑的预测模型,该模型基于从台湾各地部署的物联网设备获得的实时数据进行每小时PM2.5预测。采用平均误差、精度和计算时间等参数对结果进行分析。为了进行评估,我们在132个监测站上测试了该模型。我们将ESD模型的结果与三个基线模型进行了比较。使用ESD模型,我们能够获得低至0.16的平均误差 μ 克/ 而它是1.19 μ 克/ 对于NNAR模型,11.47 μ 克/ ARIMA模型和0.70 μ 克/ 用于混合动力车型。此外,我们能够在精度和计算时间之间取得可接受的平衡。ESD模型的计算时间为30秒,明显低于其他模型。我们的模型易于实施,也可以应用于其他城市。研究结果也可供环境保护机构用于政策管理。
虽然我们已经取得了显著的成果,但在未来的工作中仍有一些问题需要解决。一项任务是包括其他天气特征,如风速和风向,以进一步提高预测精度。此外,我们希望将该模型扩展到更长时间的预测,例如12、24和48小时。最终任务包括使用预测模型在台湾开发实时预测服务。

作者贡献

概念化,S.M.、T.-C.T.和L.-J.C。;数据管理,S.M。;方法论,S.M。;验证,S.M.和L.-J.C。;形式分析,S.M。;资源,L.-J.C。;写作——原始草稿编制,S.M。;Writing-Review&Editing,S.M.和L.-J.C。;监管、L.-J.C.和T.-C.T。;融资收购,L.-J.C。

基金

本研究部分得到了台湾科技部的资助:MOST 107-2218-E-001-006和MOST 105-2221-E-001-016-MY3,以及台湾行政院的前瞻性基础设施发展计划。

鸣谢

作者感谢台北市政府、Edimax Inc.、RealTek Inc.、gov.tw社区和LASS社区的支持、技术咨询和行政协助。

利益冲突

作者声明没有利益冲突。

缩写

本文使用了以下缩写:
可吸入颗粒物2.5直径小于2.5微米的细颗粒物
物联网物联网
AQM公司空气质量管理
IoH公司人类互联网
肝癌以人为中心的计算
MQTT公司消息队列遥测传输
IDW公司逆距离权重法
ARIMA公司自回归综合移动平均
人工神经网络人工神经网络
NNAR公司神经网络自回归
静电放电带漂移的指数平滑
MAE公司平均绝对误差
CDF公司交换分布函数

工具书类

  1. 哈姆拉,G.B。;Guha,N。;科恩,A。;F.拉登。;俄克拉荷马州Raaschou-Nielsen。;Samet,J.M。;葡萄藤,P。;Forastiere,F。;Saldiva,P。;Yorifuji,T。;户外颗粒物暴露与肺癌:一项系统综述和荟萃分析。环境。健康展望。 2014,122, 906. [谷歌学者] [交叉参考] [公共医学]
  2. 赵,J。;Liu,C.H。;陈,M。;刘,X。;Leung,K.K.通过参与式传感实现节能动态事件检测。2015年6月8日至12日,英国伦敦,IEEE国际通信会议(ICC)会议记录;第3180–3185页。[谷歌学者]
  3. 杨,J。;周,J。;吕,Z。;魏伟(Wei,W.)。;Song,H.基于无线传感器网络的工业一氧化碳实时监测系统。传感器J。 2015,15, 29535–29546. [谷歌学者] [交叉参考] [公共医学]
  4. 郑毅。;Yi,X。;李,M。;李,R。;Z.Shan。;Chang,E。;Li,T.基于大数据预测细粒度空气质量。第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集,澳大利亚悉尼,2015年8月10日至13日;第2267-2276页。[谷歌学者]
  5. 马楚克,G。天气预报中的数值方法; 爱思唯尔:美国纽约州纽约市,2012年。[谷歌学者]
  6. Dong,G.H。;张,P。;Sun,B。;张,L。;陈,X。;马,N。;Yu,F。;郭,H。;黄,H。;Lee,Y.L。;等。中国沈阳市长期暴露于环境空气污染和呼吸道疾病死亡率:一项基于人群的12年回顾性队列研究。呼吸 2012,84, 360–368. [谷歌学者] [交叉参考] [公共医学]
  7. 高,Y。;Dont,W。;郭,K。;刘,X。;陈,Y。;刘,X。;Bu,J。;Chen,C.Mosaic:用于城市空气质量监测的低成本移动传感系统。第35届IEEE国际计算机通信年会论文集,2016年4月10日至14日,美国加利福尼亚州旧金山。[谷歌学者]
  8. Cheng,Y。;李,X。;李,Z。;江,S。;李毅。;贾,J。;Jiang,X.AirCloud:一个面向所有人的基于云的空气质量监测系统。2014年11月3日至6日在美国田纳西州孟菲斯市举行的第十二届ACM嵌入式网络传感器系统会议记录。[谷歌学者]
  9. Chen,L.J。;Ho,Y.H。;Lee,H.C.公司。;吴,H.C。;刘,H.M。;Hsieh,H.H。;黄,Y.T。;Lung,S.C.C.智能城市参与式PM2.5监测的开放框架。IEEE接入 2017,5, 14441–14454. [谷歌学者] [交叉参考]
  10. 格罗弗,A。;卡普尔,A。;Horvitz,E.一种用于天气预报的深度混合模型。第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集,澳大利亚悉尼,2015年8月10-13日;第379-386页。[谷歌学者]
  11. Izzah,A。;萨里,Y.A。;Widyastuti,R。;Cinderatama,T.A.使用改进的多元线性回归进行股票预测的移动应用程序。2017年11月24日至25日在印度尼西亚马朗举行的2017年可持续信息工程与技术国际会议(SIET)会议记录;第150-154页。[谷歌学者]
  12. Cortina-Januchs,医学博士。;昆塔尼亚·多明格斯(J.Quintanilla-Dominguez)。;Vega-Corona,A。;Andina,D.墨西哥萨拉曼卡PM10浓度预测模型的开发。大气。波卢特。物件。 2015,6, 626–634. [谷歌学者] [交叉参考]
  13. Kitchin,R.实时城市?大数据和智能城市化。地理杂志 2014,79, 1–14. [谷歌学者] [交叉参考]
  14. 加扎利,R。;A.J.侯赛因。;Liatsis,P.动态岭多项式神经网络:预测单变量非平稳和平稳交易信号。专家系统。申请。 2011,38, 3765–3776. [谷歌学者] [交叉参考]
  15. Hsieh,H.P。;Lin,S.D。;Zheng,Y.基于城市大数据推算车站选址空气质量。2015年8月10日至13日,澳大利亚悉尼,第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集;第437-446页。[谷歌学者]
  16. Z.Khan。;Anjum,A。;Kiani,S.L.基于云的智能未来城市大数据分析。2013年IEEE/ACM第六届实用程序和云计算国际会议论文集,美国华盛顿特区,2013年12月9日至12日;第381-386页。[谷歌学者]
  17. A.唐纳利。;米斯泰尔,B。;Broderick,B.使用综合参数和非参数回归技术进行实时空气质量预测。大气。环境。 2015,103, 53–65. [谷歌学者] [交叉参考] [绿色版本]
  18. 郑毅。;卡普拉。;沃尔夫森,O。;Yang,H.《城市计算:概念、方法和应用》。ACM事务处理。智力。系统。Technol公司。(TIST) 2014,5, 38. [谷歌学者] [交叉参考]
  19. 朱J.Y。;张,C。;张,H。;Zhi,S。;李,V.O。;Han,J。;Zheng,Y.pg-因果关系:利用城市大数据确定大气污染物的时空因果路径。在线可用:https://ieeexplore.ieee.org/abstract/document/7970191/(2017年7月6日访问)。
  20. 施,X。;李强。;齐,Y。;黄,T。;Li,J.基于XGBoost的事故预测方法。2017年11月24日至26日,中国南京,第十二届智能系统与知识工程国际会议(ISKE)会议记录;第1-7页。[谷歌学者]
  21. Chen,T。;Guestrin,C.Xgboost:一个可扩展的树木提升系统。2016年8月13日至17日在美国加利福尼亚州旧金山举行的第22届ACM Sigkdd国际知识发现和数据挖掘会议记录;第785-794页。[谷歌学者]
  22. Chen,L.J。;Ho,Y.H。;Hsieh,H.H。;黄,S.T。;Lee,H.C.公司。;Mahajan,S.ADF:大型PM2异常检测框架。5传感系统。IEEE互联网事物 2018,5, 559–570. [谷歌学者] [交叉参考]
  23. 标准,O.MQTT 3.1.1版。在线可用:http://docs.oasis-open.org/mqtt/mqtt/v3(2014年10月29日访问)。
  24. Mahajan,S。;刘,H.M。;Tsai,T.C。;Chen,L.J.使用基于聚类的混合神经网络模型提高PM2.5预测服务的准确性和效率。IEEE接入 2018,6, 19193–19204. [谷歌学者] [交叉参考]
  25. Assimakopoulos,V。;Nikolopoulos,K.theta模型:预测的分解方法。国际期刊预测。 2000,16, 521–530. [谷歌学者] [交叉参考]
  26. 亨德曼,R.J。;Billah,B.揭开Theta方法的面纱。国际期刊预测 2003,19, 287–290. [谷歌学者] [交叉参考]
  27. 克里斯托杜洛斯,C。;Michalakelis,C。;Varoutas,D.有限数据预测:结合ARIMA和扩散模型。Technol公司。预测。Soc公司。 2010,77, 558–565. [谷歌学者] [交叉参考]
  28. Da Veiga,首席执行官。;Da Veiga,C.R.P.公司。;Catapan,A。;托尔塔托,美国。;Da Silva,W.V.《食品零售需求预测:Holt-Winters和ARIMA模型的比较》。WSEAS变速器。公共汽车。经济。 2014,11, 608–614. [谷歌学者]
  29. 亨德曼,R.J。;Athanasopoulos,G.预测:原理与实践。在线可用:https://books.google.com.hk/books?hl=en&lr=&id=_bBhDwAAQBAJ&oi=fnd&pg=PA7&dq=预测:+原则+和+实践&ots=Thh0wn0NNM&sig=q9LrK5cjJNR0PGWdJguSy_QH91M&redir_esc=y#v=onepage&q=预测(2018年5月5日访问)。
图1。拟议系统的体系结构。
图1。拟议系统的架构。
传感器18 03223 g001
图2。PM2.5传感框架流程图。
图2。PM2.5传感框架流程图。
传感器18 03223 g002
图3。小时和每日PM2.5变化。
图3。小时和每日PM2.5变化。
传感器18 03223 g003
图4。PM2.5的小时代表性 μ 克/ 三个车站。
图4。PM2.5的小时代表性 μ 克/ 用于三个车站。
传感器18 03223 g004
图5。数据可视化平台:()设备状态;(b条)Voronoi图;和(c(c))实时PM2.5可视化。
图5。数据可视化平台:()设备状态;(b条)Voronoi图;和(c(c))实时PM2.5可视化。
传感器18 03223 g005
图6。((f))-IDW污染事件动画。
图6。((f))-IDW污染事件动画。
传感器18 03223 g006
图7。ESD建模和预测框架。
图7。ESD建模和预测框架。
传感器18 03223 g007
图8。混合模型流程图。
图8。混合模型流程图。
传感器18 03223 g008
图9。132种监测模式的地理位置。
图9。132种监测模式的地理位置。
传感器18 03223 g009
图10。132个监测站PM2.5观测值与预测值的比较。
图10。132个监测站PM2.5观测值与预测值的比较。
传感器18 03223 g010
图11。与基线模型的平均误差和计算时间比较。
图11。与基线模型的平均误差和计算时间比较。
传感器18 03223 g011
图12。用于一小时预测的所有四个模型的CDF图。
图12。用于一小时预测的所有四个模型的CDF图。
传感器18 03223 g012
图13。未来3小时PM2.5观测值和预测值之间误差的CDF图。
图13。未来3小时PM2.5观测值和预测值之间误差的CDF图。
传感器18 03223 g013
表1。与基线模型的比较分析。
表1。与基线模型的比较分析。
模型平均误差( μ 克/ )计算时间(s)
静电放电0.1630
ARIMA公司11.47110
NNAR公司1.19410
混合的0.70600

分享和引用

MDPI和ACS样式

Mahajan,S。;陈立杰。;蔡,T.-C。使用指数平滑法进行PM2.5短期预测:比较分析。传感器 2018,18, 3223.https://doi.org/10.3390/s18103223

AMA风格

Mahajan S、Chen L-J、Tsai T-C。使用指数平滑法进行PM2.5短期预测:比较分析。传感器. 2018; 18(10):3223.https://doi.org/10.3390/s18103223

芝加哥/图拉宾风格

Mahajan、Sachit、Ling-Jyh Chen和Tzu Chieh Tsai。2018年,“使用指数平滑法进行PM2.5短期预测:比较分析”传感器18,编号10:3223。https://doi.org/10.3390/s18103223

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章指标

返回页首顶部