跳到主要内容

kdANN+:大数据快速AkNN分类器

  • 第章
  • 首次在线:

系列丛书的一部分: 计算机科学讲义(TLDKS,第9510卷)

摘要

A类k个-最近的邻居(k个NN)查询确定k个距离给定位置最近的点,使用距离度量。一个allk个-最近邻(Ak个NN)查询构成k个NN查询并检索k个数据库中每个点的最近点。它们的主要用途在空间数据库中产生共鸣,它们不仅是许多基于位置的应用程序的主干。在这项工作中,我们提出了一种使用a分类多维数据的新方法k个MapReduce框架中的NN算法。我们的方法利用空间分解技术以并行和分布式的方式处理分类过程。据我们所知,我们是第一个研究k个在此视角下多维对象的NN分类。通过广泛的实验评估,我们证明了我们的解决方案在处理给定查询时是高效、健壮和可扩展的。

这是订阅内容的预览,通过机构登录.

购买期权

第章
29.95欧元
价格包括增值税(中国)
  • 以PDF格式提供
  • 在任何设备上读取
  • 即时下载
  • 永远拥有它
电子书
42.79欧元
价格包括增值税(中国)
  • 以EPUB和PDF格式提供
  • 在任何设备上读取
  • 即时下载
  • 永远拥有它
软封面书籍
49.99欧元
价格不含增值税(中国)
  • 紧凑、轻量级版本
  • 3至5个工作日内发货
  • 全球免费送货-查看信息

税务计算将在结账时完成

购买仅供个人使用

了解机构订阅

笔记

  1. 1

    真正的数据集是加拿大行星模拟地形3D映射数据集的一部分,该数据集是在加拿大两个独特的行星模拟漫游器测试设施收集的三维激光扫描数据集。数据集提供坐标(x个z(z))每次激光扫描的单位为米。http://asrl.utias.utoronto.ca/datasets/3dmap/.

工具书类

  1. Aji,A.,Wang,F.,Vo,H.,Lee,R.,Liu,Q.,Zhang,X.,Saltz,J.:Hadoop GIS:基于MapReduce的高性能空间数据仓库系统。程序。荷兰VLDB。6, 1009–1020 (2013)

    第条 谷歌学者 

  2. Afrati,F.N.,Ullman,J.D.:在地图缩减环境中优化连接。摘自:《第13届扩展数据库技术国际会议论文集》,第99-110页。ACM,纽约(2010年)

    谷歌学者 

  3. Böhm,C.,Krebs,F.:k近邻加入:为KDD过程提供涡轮增压。知识。信息系统。6, 728–749 (2004)

    第条 谷歌学者 

  4. Chatzimilioudis,G.,Zeinalipour-Yazti,D.,Lee,W.C.,Dikaiakos,M.D.:智能手机网络中的连续全k近邻查询。摘自:2012年IEEE第13届移动数据管理国际会议记录,第79-88页。IEEE计算机学会,华盛顿特区(2012年)

    谷歌学者 

  5. Chang,J.,Luo,J.、Huang,J.Z.、Feng,S.、Fan,J.:基于最小生成树的大规模数据分类模型,采用mapreduce实现。摘自:第十届IEEE数据挖掘国际会议论文集,第129-137页。IEEE计算机学会,华盛顿特区(2010年)

    谷歌学者 

  6. Chen,Y.,Patel,J.M.:所有最近邻查询的有效评估。摘自:第23届IEEE国际数据工程会议记录,第1056–1065页。IEEE计算机协会,华盛顿特区(2007年)

    谷歌学者 

  7. 科克塞特,H.S.M.:正则多面体。多佛出版社,纽约(1973)

    谷歌学者 

  8. 克伦威尔,P.R.:多面体。剑桥大学出版社,剑桥(1999)

    数学 谷歌学者 

  9. Dean,J.,Ghemawat,S.:MapReduce:大型集群上的简化数据处理。摘自:第六届操作系统设计与实现研讨会论文集,第137-150页。USENIX协会,伯克利(2004)

    谷歌学者 

  10. Dunham,M.H.:数据挖掘:入门和高级主题。Prentice Hall,Upper Saddle River(2002年)

    谷歌学者 

  11. Eldawy,A.:SpatialHadoop:使用mapreduce实现灵活和可伸缩的空间处理。2014年SIGMOD博士研讨会论文集,第46-50页。ACM,纽约(2014)

    谷歌学者 

  12. Emrich,T.,Graf,F.,Kriegel,H.-P,Schubert,M.,Thoma,M.:使用三角修剪优化所有最近邻查询。收录:Gertz,M.,Ludäscher,B.(编辑)SSDBM 2010。LNCS,第6187卷,第501-518页。斯普林格,海德堡(2010)

    第章 谷歌学者 

  13. Gkoulalas-Divanis,A.,Verykios,V.S.,Bozanis,P.:轨迹数据中在线请求的网络感知隐私模型。数据知识。工程师。68, 431–452 (2009)

    第条 谷歌学者 

  14. 何,Q.,庄,F.,李,J.,石,Z.:基于mapreduce的分类算法的并行实现。收录人:Yu,J.、Greco,S.、Lingras,P.、Wang,G.、Skowron,A.(编辑)RSKT 2010。LNCS,第6401卷,第655-662页。斯普林格,海德堡(2010)

    第章 谷歌学者 

  15. Ioup,E.,Shaw,K.,Sample,J.,Abdelguerfi,M.:使用M-tree的高效AKNN空间网络查询。摘自:第15届ACM地理信息系统进展国际研讨会论文集,第46:1–46:4页。ACM,纽约(2007)

    谷歌学者 

  16. Lee,K.,Ganti,R.K.,Srivatsa,M.,Liu,L.:大数据的高效空间查询处理。摘自:第22届ACM SIGSPATIAL地理信息系统进展国际会议记录,第469-472页。ACM,纽约(2014)

    谷歌学者 

  17. Lu,W.,Shen,Y.,Chen,S.,Ooi,B.C.:使用mapreduce高效处理k个最近邻连接。程序。荷兰VLDB。5, 1016–1027 (2012)

    第条 谷歌学者 

  18. Rajaraman,A.,Ullman,J.D.:海量数据集的挖掘。剑桥大学出版社,纽约(2011)

     谷歌学者 

  19. Roussopoulos,N.,Kelley,S.,Vincent,F.:最近邻居查询。1995年ACM SIGMOD国际数据管理会议记录,第71–79页。ACM,纽约(1995)

    谷歌学者 

  20. Samet,H.:四叉树和相关的分层数据结构。ACM计算。Surv公司。16, 187–260 (1984)

    第条 数学科学网 谷歌学者 

  21. Stupar,A.,Michel,S.,Schenkel,R.:RankReduce-在MapReduce之上处理k近邻查询。摘自:《第八届信息检索大规模分布式系统研讨会论文集》,第13-18页(2010年)

    谷歌学者 

  22. apache软件基金会:Hadoop主页。http://hadoop.apache.org/

  23. Tsoumakos,D.、Konstantinou,I.、Boumpouka,C.、Sioutas,S.、Koziris,N.:使用tiramola为nosql集群提供自动化、弹性资源。摘自:第13届IEEE/ACM集群、云和网格计算国际研讨会论文集,第34-41页(2013年)

    谷歌学者 

  24. Vernica,R.,Carey,M.J.,Li,C.:使用MapReduce的高效并行集合相似性联接。摘自:ACM SIGMOD国际数据管理会议记录,第495-506页。ACM,纽约(2010年)

    谷歌学者 

  25. 怀特,T.:《Hadoop:最终指南》,第三版。O'Reilly Media/雅虎出版社(2012)

    谷歌学者 

  26. Xia,C.,Lu,H.,Chin,B.,Hu,O.J.:Gorder:一种有效的KNN连接处理方法。收录于:VLDB,第756–767页。VLDB捐赠(2004年)

    谷歌学者 

  27. Yao,B.,Li,F.,Kumar,P.:K最近邻查询和KNN-加入大型关系数据库(几乎)是免费的。摘自:第26届国际数据工程会议记录,第4-15页。IEEE计算机学会,华盛顿特区(2010年)

    谷歌学者 

  28. Yokoyama,T.,Ishikawa,Y.,Suzuki,Y.:处理所有k个-hadoop中的最近邻查询。作者:Gao,H.,Lim,L.,Wang,W.,Li,C.,Chen,L.(编辑)WAIM 2012。LNCS,第7418卷,第346–351页。斯普林格,海德堡(2012)

    第章 谷歌学者 

  29. Yu,C.,Cui,B.,Wang,S.,Su,J.:高维数据的高效基于索引的KNN连接处理。Inf.软件。Technol公司。49, 332–344 (2007)

    第条 谷歌学者 

  30. Zhang,C.,Li,F.,Jestes,J.:MapReduce中用于大数据的高效并行kNN连接。摘自:《第15届扩展数据库技术国际会议论文集》,第38-49页。ACM,纽约(2012)

    谷歌学者 

  31. Zhang,J.,Mamoulis,N.,Papadias,D.,Tao,Y.:空间数据库中的所有最近邻查询。摘自:《第16届国际科学和统计数据库管理会议记录》,第297-306页。IEEE计算机学会,华盛顿特区(2004)

    谷歌学者 

下载参考资料

致谢

这项研究由欧盟(欧洲社会基金会ESF)和希腊国家基金会通过国家战略参考框架(NSRF)的“教育和终身学习”业务计划共同资助——研究资助计划:泰雷兹。通过欧洲社会基金投资于知识社会。

作者信息

作者和附属机构

作者

通讯作者

与的通信尼古拉·诺达拉基斯.

编辑器信息

编辑和附属机构

权利和权限

转载和许可

版权信息

©2016施普林格-弗拉格-柏林-海德堡版权所有

关于本章

引用本章

Nodarakis,N.、Pitoura,E.、Sioutas,S.、Tsakalidis,A.、Tsoumakos,D.、Tzimas,G.(2016)。kdANN+:大数据快速AkNN分类器。收录人:Hameurlain,A.、Küng,J.、Wagner,R.、Decker,H.、Lhotska,L.、Link,S.(编辑)《大尺度数据和知识中心系统交易》第二十四卷。《计算机科学讲义》(),第9510卷。施普林格,柏林,海德堡。https://doi.org/10.1007/978-3-662-49214-7_5

下载引文

  • 内政部:https://doi.org/10.1007/978-3-662-49214-7_5

  • 出版:

  • 发布者名称:施普林格、柏林、海德堡

  • 打印ISBN:978-3-662-49213-0

  • 在线ISBN:978-3-662-49214-7

  • 电子书包:计算机科学计算机科学(R0)

与我们一起发布

政策和道德