×

通过趋势聚类发现总结数字空间数据流。 (英语) Zbl 1403.68179号

概要:普适计算和传感器技术的进步为地球物理数据流爆炸性的普遍存在铺平了道路。管理产生的海量且无限的传感器数据流带来了一些挑战,包括实时应用摘要技术,该技术应允许在内存有限的服务器中存储和查询如此数量的地理参考数据和时间戳数据。为了解决这个问题,我们设计了一种称为SUMATRA的摘要技术,它将流分割成多个窗口,逐窗口计算摘要并将这些摘要存储在数据库中。趋势簇被发现为每个窗口的摘要。它们是地理参考数据的簇,根据窗口时间范围内的类似趋势而变化。还研究了几种压缩技术,以获得这些趋势在数据库中存储的紧凑但准确的表示。设计了一种自动选择最佳趋势压缩技术的学习策略。最后,研究了基于树的趋势簇发现的网络内模式,以实现有效的聚合模式,从而大幅减少网络传输的字节数,并保持更长的网络寿命。此模式映射到基于树的WSN拓扑的路由结构。使用真实传感器网络的多个数据流进行的实验评估了所提摘要模式的摘要能力、准确性和效率。

MSC公司:

68T05年 人工智能中的学习和自适应系统
62小时30分 分类和区分;聚类分析(统计方面)
62J05型 线性回归;混合模型

软件:

接触群;标签
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Acharya S、Gibbons PB、Poosala V(2000)《国会关于群体查询近似回答的样本》。摘自:国际数据管理会议记录,SIGMOD 2000。ACM,纽约,第487-498页
[2] Aggarwal CC,Han J,Wang J,Yu PS(2007)《海量数据流聚类:摘要范式》。收录:数据库系统进展:数据流模型和算法,第31卷。海德堡施普林格,第9-38页·Zbl 1126.68033号
[3] Ai C,Du R,Zhang M,Li Y(2009)无线传感器网络中基于分布式索引技术的网络内历史数据存储和查询处理。收录:2009年WASA第四届无线算法系统和应用国际会议论文集。柏林施普林格,第264-273页
[4] Al Wadi S,Ismail MT,Karim SAA(2010)Haar小波变换和快速傅立叶变换在分析金融时间序列数据中的比较。《应用科学研究杂志》5(5):352-360·doi:10.3923/rjasci.2010.352.360
[5] Alon N,Matias Y,Szegedy M(1996)近似频率矩的空间复杂性。摘自:1996年STOC第28届ACM计算理论年会论文集。ACM,纽约,第20-29页·Zbl 0922.68057号
[6] Armenakis C(1992)时空数据的估计和组织。收录:加拿大GIS92会议记录,第900-911页
[7] Browdy MH(1990)《模拟退火:政治再划分的改进计算机模型》。耶鲁大学法律政策修订版8(1):163-179
[8] Buratti C、Conti A、Dardari D、Verdone R(2009)《无线传感器网络技术和发展概述》。传感器9:6869-6896·doi:10.3390/490906869
[9] Chen Z,Yang S,Li L,Xie Z(2010)无线传感器网络中基于数据空间相关性的聚类近似机制。摘自:第九届无线通信研讨会会议记录,WTS 2010。IEEE出版社,皮斯卡塔韦,第208-214页
[10] Chiky R,Hébrail G(2008)总结了数据仓库中存储的分布式数据流。摘自:第十届数据仓库和知识发现国际会议论文集,DaWaK 2008。计算机科学课堂讲稿,第5182卷。柏林施普林格,第65-74页
[11] Chou Y(1975)《统计分析》,第二版。Holt,Rinehart&Winston of Canada Ltd,纽约
[12] Ciampi A,Appice A,Malerba D(2010)地理分布数据流摘要。摘自:KES 2010第14届知识型和智能型信息与工程系统国际会议记录。计算机科学课堂讲稿,第6278卷。柏林施普林格,第339-348页
[13] Ciampi A、Appice A、Malerba D(2010)空间分布数据流中的在线和离线趋势聚类发现。收录:Atzmüller M、Hotho A、Strohmaier M、Chin A(编辑)关于分析社交媒体和无处不在数据的国际研讨会,2010年MSM和2010年MUSE,修订选定论文。计算机科学课堂讲稿,第6904卷。柏林施普林格,第142-161页
[14] Ciampi A、Appice A、Malerba D、Guccione P(2011)基于趋势聚类的地理分布数据流压缩。摘自:IEEE计算智能和数据挖掘研讨会论文集,2011年CIDM,2011年IEEE计算智慧研讨会系列的一部分,第168-175页
[15] Draper NR,Smith H(1982)应用回归分析。纽约威利
[16] Duque J、Ramos R、Surinach J(2007)《监督区域化方法:调查》。国际注册科学版次30:195-220·doi:10.1177/016017607301605
[17] Furfaro F、Mazzeo GM、SaccáD、Sirangelo C(2008)压缩层次二进制直方图,用于汇总多维数据。知情信息系统15(3):335-380·doi:10.1007/s10115-007-0087-1
[18] Gaber MM,Zaslavsky A,Krishnaswamy S(2005)《采矿数据流:综述》。ACM SIGMOD记录34(2):18-26·doi:10.1145/1083784.1083789
[19] Ganesan D、Greenstein B、Estrin D、Heidemann JS、Govindan R(2005)《传感器网络中的多分辨率存储和搜索》。ACM TOS 1(3):277-315·doi:10.1145/10847791084780
[20] Garofalakis M,Kumar A(2004)最大误差度量的确定性小波阈值。摘自:2004年第23届数据库系统原理研讨会论文集。ACM,纽约,第166-176页
[21] Gilbert AC、Guha S、Indyk P、Kotidis Y、Muthukrishnan S、Strauss MJ(2002)用于近似直方图维护的快速小空间算法。摘自:2002年STOC第24届ACM计算理论年会论文集。ACM,纽约,第389-398页·Zbl 1192.68962号
[22] Gordon AD(1996)约束分类调查。计算统计数据分析21(1):17-29·Zbl 0900.62313号 ·doi:10.1016/0167-9473(95)00005-4
[23] Greenwald M,Khanna S(2001)分位数摘要的空间效率在线计算。ACM SIGMOD记录30(2):58-66·doi:10.1145/376284.375670
[24] 郭D(2008)动态约束集聚聚类与分割的区域化(redcap)。国际地理信息科学杂志22(7):801-823·doi:10.1080/13658810701674970
[25] Hershberger J,Shrivastava N,Suri S,Toth CD(2006)多维数据流的自适应空间分区。算法46(1):97-117·Zbl 1100.68015号 ·doi:10.1007/s00453-006-0070-3
[26] Hutson J(1983)TRIX:三指数平滑振荡器?股票和商品的技术分析
[27] Ioanidis YE,Poosala V(1995),平衡直方图优化和查询结果大小估计的实用性。摘自:国际数据管理会议记录,SIGMOD 1995。ACM,纽约,第233-244页
[28] Jagadish HV、Koudas N、Muthukrishnan S、Poosala V、Sevcik KC、Suel T(1998)《具有质量保证的最佳直方图》。收录:1998年VLDB第24届超大数据库国际会议论文集。Morgan Kaufmann,旧金山,第275-286页
[29] Jurcík P、Severino R、Koubaa A、Alves M、Tovar E(2008)具有移动汇行为的集群树传感器网络实时通信。在:第14届IEEE嵌入式和实时计算系统及应用国际会议论文集,RTCSA 2008。IEEE计算机学会,第401-412页
[30] Kittler J(1976)聚类分析的局部敏感性方法。模式识别,第22-33页·Zbl 0347.68051号
[31] Kontaki M、Papadopoulos AN、Manolopulos Y(2008)数据流中基于趋势的连续聚类。摘自:第十届数据仓库和知识发现国际会议论文集,DaWaK 2008。计算机科学讲义,第5182卷。柏林施普林格,第251-262页
[32] Legendre P(1987)约束聚类。摘自:LegendreP,Legendre-L(eds)《数值生态学的发展》,柏林施普林格,第289-307页
[33] Legendre P(1993)空间自相关:问题还是新范式?生态学74:1659-1673·doi:10.2307/1939924
[34] LeSage J,Pace K(2001),数据挖掘中的空间依赖性。领域:科学和工程应用的数据挖掘。波士顿Kluwer,第439-460页
[35] Lin J,Keogh EJ,Wei L,Lonardi S(2007)《体验萨克斯:时间序列的新型符号表示》。数据最小知识发现15(2):107-144·数字对象标识码:10.1007/s10618-007-0064-z
[36] Ma X,Li S,Luo Q,Yang D,Tang S(2007),传感器网络中的分布式、分层聚类和摘要。摘自:《第九届亚太联合网络和第八届网络时代信息管理及数据和网络管理进展国际会议论文集》,APWeb/WAIM 2007,柏林斯普林格,第168-175页
[37] Madden S、Franklin MJ、Hellerstein JM、Hong W(2002)Tag:一种用于自组织传感器网络的小型聚合服务。收录:Culler DE,Druschel P(eds)《第五届操作系统设计与实现研讨会论文集》,OSDI 2002。USENIX协会
[38] Malerba D,Appice A,Varlaro A,Lanza A(2005)结构化对象的空间聚类。摘自:第15届归纳逻辑编程国际会议论文集,ILP 2005。计算机科学课堂讲稿,第3625卷。柏林施普林格,第227-245页·Zbl 1134.68477号
[39] Mallat S(1998)《信号处理的小波教程》。伦敦学术出版社·Zbl 0937.94001号
[40] Matias Y,Vitter JS,Wang M(2000)基于小波直方图的动态维护。收录:第26届超大数据库国际会议论文集,VLDB 2000。Morgan Kaufmann,旧金山,第101-110页
[41] Motwani R,Raghavan P(1995)随机算法。剑桥大学出版社·Zbl 0849.68039号 ·doi:10.1017/CBO9780511814075
[42] Murtagh F(1985)邻接约束聚类算法及相关问题综述。计算J 28(1):82-88·doi:10.1093/comjnl/28.182
[43] Nassar S,Sander J(2007)《历史流挖掘多维数据流的有效总结》。摘自:第19届科学和统计数据库管理国际会议论文集,SSDBM 2007。IEEE计算机学会,第30页
[44] Perruchet C(1983)约束聚合层次分类。模式识别,第213-217页
[45] Proakis JG、Manolakis DG(1996)《数字信号处理:原理、算法和应用》。Prentice-Hall,上鞍河
[46] Recchia A(2010)使用sas的邻接约束层次凝聚聚类。J统计软件33
[47] Rodrigues PP、Gama J、Lopes LMB(2008)《分布式传感器数据流聚类》。收录:欧洲机器学习和数据库知识发现会议记录。计算机科学课堂讲稿,第5212卷。柏林施普林格,第282-297页
[48] Rusu F,Dobra A(2009)绘制采样数据流。摘自:2009年第25届国际数据工程会议记录。IEEE计算机学会,第381-392页
[49] Sanjay C,Shashi S,Wu W(2001)《挖掘地理空间数据的空间相关性建模:简介》。领域:地理数据挖掘和知识发现。泰勒和弗朗西斯,伦敦,第131-159页
[50] Shekhar S,Chawla S(2003),《空间数据库:巡视》。Prentice Hall,上鞍河
[51] Su W,Akan O,Cayirci E(2004)传感器网络通信协议。In:Raghavendra CS、Sivalingam KM、Znati T(eds)无线传感器网络。柏林施普林格,第21-50页
[52] Thaper N,Guha S,Indyk P,Koudas N(2002)动态多维直方图。摘自:国际数据管理会议记录,SIGMOD 2002。ACM,纽约,第428-439页
[53] Thiesson B,Kin J(2012)《快速变分寻模》。附:2012年AISTATS第15届国际人工智能与统计会议记录
[54] Tobler W(1979)细胞地理学。地理哲学。多德雷赫特·克鲁沃,第379-386页
[55] Valkanas G、Kotsifakos A、Gunopulos D、Galpin I、Gray AJG、Fernandes AAA、Paton NW(2011)《在传感器网络中部署网络内数据分析技术》。摘自:Zaslavsky AB、Chrysanthis PK、Lee DL、Chakraborty D、Kalogeraki V、Mokbel MF、Chow CY(eds)《第十二届IEEE移动数据管理国际会议论文集》,MDM 2011。第341-344页
[56] Watfa M,Daher W,Azar HA(2009)传感器网络数据聚合技术。国际计算机理论与工程1(1):1793-82013
[57] Wise SM、Haining RP、Ma J(1997)《健康数据探索性空间分析的区域化工具》。收录:Fischer M、Hewings G、Nagurney A、Nijkamp F、Snickars P(编辑)空间分析的最新发展:空间统计、行为建模和神经计算,区域科学系列。柏林施普林格,第83-100页
[58] Yoon S,Shahabi C(2005)利用空间相关性实现节能集群聚集技术(cag)。收录:IEEE通信国际会议记录
[59] Yoon S,Shahabi C(2007)利用无线传感器网络中的空间和时间相关性的集群聚合(cag)技术。ACM传输传感器网络3(1)
[60] Zhu Y,Shasha D(2002)Statstream:实时统计监测数千个数据流。收录:第28届超大数据库国际会议论文集,VLDB 2002。VLDB捐赠,第358-369页
[61] Zodan D、Martínez B、Vilajosana I、Rossi M(2012)《压缩或不压缩:能量受限传感器网络的处理与传输权衡》。CoRR abs/1206.2129
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。