×

流数据在线贝叶斯分析的可组合模型。 (英语) Zbl 1430.62270号

摘要:数据量和速度都在迅速增长,物联网(IoT)是这类数据的重要来源之一。物联网是一组连接的设备(物体),这些设备使用车载传感器不断记录来自周围环境的数据。这些设备可以以非常高的速度记录数据并将其流式传输到云中,这导致了较高的存储和分析成本。为了降低这些成本,将数据建模为流并进行在线分析,以了解基本过程,执行插值和平滑,并进行预测和预测。传统的状态空间建模工具假设观测值发生在固定的规则时间网格上。然而,许多传感器有时会自适应地改变其采样频率,或者与之前的采样网格中断并重新启动,或者只是在不规则的时间生成事件数据。因此,需要将系统建模为一个在连续时间内演化的部分和不规则观测的马尔可夫过程。过程和观测模型都可能是非线性的。因此,粒子过滤器代表了在线分析的最简单方法。为了对物联网中捕获的各种数据进行建模,开发了一个可组合连续时间马尔可夫过程模型的功能Scala库。

MSC公司:

62兰特 大数据和数据科学的统计方面
2015年1月62日 贝叶斯推断
65立方厘米 马尔可夫链的数值分析或方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrieu,C.,Roberts,G.O.:有效蒙特卡罗计算的伪边缘方法。Ann.Stat.37,697-725(2009年)·Zbl 1185.60083号 ·doi:10.1214/07-AOS574
[2] Andrieu,C.,Doucet,A.,Holenstein,R.:粒子马尔可夫链蒙特卡罗方法。J.R.统计社会服务。B统计方法。72(3), 269-342 (2010) ·Zbl 1184.65001号 ·文件编号:10.1111/j.1467-9868.2009.00736.x
[3] Beckman,B.:卡尔曼折叠,第1部分,从数据中提取模型,一次一个观察结果(2016年)。预印本;vixra URLhttp://vixra.org/abs/1606.0328
[4] Bellotto,N.,Hu,H.:用移动机器人跟踪人:卡尔曼滤波器和粒子滤波器的比较。摘自:第13届IASTED机器人技术与应用国际会议记录,第1卷,第388-393页(2007年)
[5] Carvalho,C.M.,Johannes,M.S.,Lopes,H.F.,Polson,N.G.:粒子学习和平滑。统计科学。25(1), 88-106 (2010) ·Zbl 1328.62541号 ·doi:10.1214/10-STS325
[6] Chiusano,P.,Bjarnason,R.:Scala中的函数编程。曼宁出版公司,格林威治(2014)
[7] Del Moral,P.:Feynman-Kac公式:谱系和相互作用粒子系统及其应用。施普林格,纽约(2004)·Zbl 1130.60003号 ·doi:10.1007/978-1-4684-9393-1
[8] Doucet,A.,de Freitas,N.,Gordon,N.:实践中的序贯蒙特卡罗方法。施普林格,纽约(2001)·Zbl 0967.00022号 ·doi:10.1007/978-1-4757-3437-9
[9] Doucet,A.,Pitt,M.K.,Deligiannidis,G.,Kohn,R.:使用无偏似然估计量时马尔可夫链蒙特卡罗的有效实现。生物特征102(2),295(2015)·Zbl 1452.62055号 ·doi:10.1093/biomet/asu075
[10] Ghahramani,Z.,Jordan,M.:因子隐马尔可夫模型。机器。学习。273, 245-273 (1997) ·Zbl 0892.68080号 ·doi:10.1023/A:1007425814087
[11] Gordon,N.J.、Salmond,D.J.、Smith,A.F.:非线性/非高斯贝叶斯状态估计的新方法。In:IEE Proceedings F-Radar and Signal Processing,IET,第140卷,第107-113页(1993)
[12] Ionides,E.L.,Bretó,C.,King,A.A.:非线性动力系统的推断。程序。美国国家科学院。科学。美国103(49),18438-18443(2006)·doi:10.1073/pnas.0603181103
[13] James,P.、Dawson,R.、Harris,N.、Joncyzk,J.:城市天文台交通。纽卡斯尔大学(2014)。https://doi.org/10.17634/154300-21
[14] Julier,S.J.、Uhlmann,J.K.:卡尔曼滤波器对非线性系统的新扩展。摘自:AeroSense’97,国际光学和光子学学会,第182-193页(1997)
[15] Kalman,R.E.:线性滤波和预测问题的新方法。《基础工程杂志》82(1),35-45(1960)·数字对象标识代码:10.1115/1.3662552
[16] King,A.A.,Nguyen,D.,Ionides,E.L.:通过R包pomp对部分观测到的马尔可夫过程进行统计推断。J.统计软件。69(12), 1-43 (2015)
[17] Kloeden,P.E.,Platen,E.:随机微分方程的高阶隐式强数值格式。《统计物理学杂志》。66(1-2), 283-314 (1992) ·兹伯利0925.65261 ·doi:10.1007/BF01060070
[18] Lunn,D.J.,Thomas,A.,Best,N.,Spiegelhalter,D.:WinBUGS——贝叶斯建模框架:概念、结构和可扩展性。统计计算。10(4), 325-337 (2000) ·doi:10.1023/A:1008929526011
[19] Meijer,E.,Fokkinga,M.,Paterson,R.:用香蕉、镜头、信封和带刺铁丝网进行功能编程。收录于:《函数编程语言与计算机体系结构》,施普林格出版社,第124-144页(1991年)
[20] Murphy,K.P.:机器学习:概率观点。麻省理工学院出版社,剑桥(2012)·Zbl 1295.68003号
[21] Murray,L.M.:使用LibBi.J.Stat.Softw对高性能硬件进行贝叶斯状态空间建模。67(10), 1-36 (2015) ·doi:10.18637/jss.v067.i10
[22] Murray,L.M.、Lee,A.、Jacob,P.E.:粒子过滤器中的并行重采样。J.计算。图表。Stat.25(3),789-805(2016)·doi:10.1080/10618600.2015.06205
[23] NECA(2016)开放数据服务|东北联合管理局。https://www.nettraveldata.co.uk网址/
[24] Odersky,M.,Altherr,P.,Cremet,V.,Emir,B.,Maneth,S.,Micheloud,S.、Mihaylov,N.、Schinz,M.、Stenman,E.、Zenger,M.:Scala编程语言概述。技术报告IC/2004/64,瑞士洛桑EPFL(2004)
[25] Oksendal,B.:随机微分方程:应用简介。施普林格,纽约(2013)·Zbl 1334.00056号
[26] R核心团队(2015)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org网站/
[27] Ścibior,A.,Ghahramani,Z.,Gordon,A.D.:单子的实用概率规划。收录于:ACM SIGPLAN通知,ACM,第50卷,第165-176页(2015)
[28] Simon,D.:最佳状态估计:卡尔曼、H无穷大和非线性方法。威利,纽约(2006)·doi:10.1002/04700045345
[29] Todeschini,A.,Caron,F.,Fuentes,M.:Biips:相互作用粒子系统的贝叶斯推断(2017)。http://biips.github.io/
[30] Vieira,R.,Wilkinson,D.J.:动态广义线性模型中的在线状态和参数估计(2016)。http://arxiv.org/abs/1608.086661608.08666
[31] Wasserman,L.:贝叶斯模型选择和模型平均。数学杂志。精神病。44(1), 92-107 (2000) ·Zbl 0946.62032号
[32] West,M.,Harrison,J.:贝叶斯预测和动态模型,第2版。施普林格,纽约(1997)·Zbl 0871.62026号
[33] Zaharia,M.,Chowdhury,M.,Franklin,M.J.,Shenker,S.,Stoica,I.:Spark:使用工作集的集群计算。热云10(10-10),95(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。