跳到主要内容
登录

JackHare:使用MapReduce将SQL转换为NoSQL的框架

  • 出版:
自动化软件工程 目标和范围 提交手稿

摘要

近年来,随着数据探索的快速发展,数据存储和数据处理在提取重要信息方面越来越受到重视。无论是在关系数据库系统还是新兴的NoSQL数据库中,找到一个可扩展的解决方案来处理大规模数据都是一个关键问题。由于Hadoop固有的可扩展性和容错性,MapReduce对于并行处理海量数据很有吸引力。以前的研究大多集中在使用Hadoop分布式文件系统开发SQL或类似SQL的查询转换器。然而,在这种文件系统中频繁更新数据可能很困难。因此,我们需要一个作为HBase的灵活数据存储,不仅要将数据放在扩展存储系统上,还要以透明的方式操作可变数据。然而,HBase界面对大多数用户来说不够友好。由SQL客户端应用程序和到HBase的数据库连接组成的GUI将简化学习过程。本文提出了带有SQL查询编译器、JDBC驱动程序的JackHare框架,以及使用MapReduce框架处理HBase中非结构化数据的系统方法。将JDBC驱动程序导入SQL客户端GUI后,我们可以利用HBase作为底层数据存储来执行ANSI-SQL查询。实验结果表明,我们的方法具有良好的效率和可扩展性。

这是订阅内容的预览,通过机构登录 以检查访问。

访问此文章

价格包括增值税(中国)

即时访问全文PDF。

图1
图2
图3
图4
图5
图6
图7
图8
图9

其他人正在查看的类似内容

工具书类

  • Abouzeid,A.、Bajda-Pawlikowski,K.、Abadi,D.、Silberschatz,A.、Rasin,A.:HadoopDB:用于分析工作负载的MapReduce和DBMS技术的架构混合。收录:VLDB捐赠会议记录。VLDB捐赠基金会,Armonk第922-933页(2009年)

    谷歌学者 

  • Afrati,F.N.,Ullman,J.D.:在地图还原环境中优化连接。摘自:《第十三届扩展数据库技术国际会议论文集》,第99–110页(2010年)

    第章 谷歌学者 

  • Apache Hadoop:http://hadoop.apache.org(2013年)

  • Apache HBase:http://hbase.apache.org(2013年)

  • Binnig,C.,Rehrmann,R.,Faerber,F.,Riewe,R.:FunSQL:是时候让SQL发挥作用了。摘自:2012年EDBT/ICDT联合研讨会会议记录,第41-46页。ACM,纽约(2012)

    第章 谷歌学者 

  • Blanas,S.、Patel,J.M.、Ercegovac,V.、Rao,J.、Shekita,E.J.、Tian,Y.:MaPreduce中日志处理连接算法的比较。摘自:2010年ACM SIGMOD国际数据管理会议记录,第975–986页(2010)

    第章 谷歌学者 

  • Chang,F.,Dean,J.,Ghemawat,S.,Hsieh,W.C.,Wallach,D.A.,Burrows,M.,Chandra,T.,Fikes,A.,Gruber,R.E.:大表:一种用于结构化数据的分布式存储系统。ACM事务处理。计算。系统。26(2), 1–26 (2008)

    第条 数学 谷歌学者 

  • Dean,J.,Ghemawat,S.:MapReduce:大型集群上的简化数据处理。Commun公司。ACM公司51(1), 107–113 (2008)

    第条 谷歌学者 

  • Ghemawat,S.、Gobioff,H.、Leung,S.:谷歌文件系统。摘自:《第十九届ACM操作系统原理研讨会论文集》,第29-43页。ACM,纽约(2003年)

    第章 谷歌学者 

  • Gowraj,N.、Ravi,P.V.、Sumalatha,M.R.:S2MART:智能sql到地图还原翻译人员。收录:《网络技术与应用学报》。LNCS,第7808卷,第571-582页。柏林施普林格出版社(2013)

    第章 谷歌学者 

  • Hive HBase集成(2013)。https://cwiki.apache.org/Hive/hbaseintegration.html

  • Kaldewey,T.、Shekita,E.J.、Tata,S.:Clydesdale:MapReduce上的结构化数据处理。摘自:《第15届扩展数据库技术国际会议论文集》,第15-25页。ACM,纽约(2012)

    第章 谷歌学者 

  • Lee,R.,Luo,T.,Huai,Y.,Wang,F.,He,Y..,Zhang,X.Y.:又一个SQL-to-MapReduce翻译器。摘自:《2011年第31届分布式计算系统国际会议论文集》,华盛顿,第25-36页(2011)

    第章 谷歌学者 

  • Okcan,A.,Riedewald,M.:使用MapReduce处理θ连接。2011年ACM SIGMOD国际数据管理会议记录,第949-960页。ACM,纽约(2011)

    第章 谷歌学者 

  • Olston,C.,Reed,B.,Srivastava,U.,Kumar,R.,Tomkins,A.:猪拉丁语:用于数据处理的非外语。摘自:2008年ACM SIGMOD国际数据管理会议记录,第1099–1110页。ACM,纽约(2008)

    第章 谷歌学者 

  • Pavlo,A.、Paulson,E.、Rasin,A.、Abadi,D.J.、DeWitt,D.J、Madden,S.、Stonebraker,M.:大规模数据分析方法的比较。摘自:2009年ACM SIGMOD国际数据管理会议记录,第165-178页。ACM,纽约(2009)

    谷歌学者 

  • Stonebraker,M.,Cattell,R.:“简单操作”数据存储中可伸缩性能的10条规则。Commun公司。ACM公司54(6), 72–80 (2011)

    第条 谷歌学者 

  • Su,X.,Swart,G.:Oracle in-database hadoop:当mapreduce遇到RDBMS时。摘自:2012年ACM SIGMOD国际数据管理会议记录,第779–790页。ACM,纽约(2012)

    第章 谷歌学者 

  • Thusoo,A.、Sarma,J.S.、Jain,N.、Shao,Z.、Chakka,P.、Anthony,S.、Liu,H.、Wyckoff,P.和Murthy,R.:蜂巢:基于地图还原框架的仓储解决方案。收录:VLDB捐赠会议录。VLDB捐赠基金会,Armonk第1626–1629页(2009年)

    谷歌学者 

  • Xu,Y.,Hu,S.:QMapper:使用查询重写在配置单元上进行SQL优化的工具。摘自:第22届国际互联网协会会议记录,第212-221页。ACM,日内瓦(2013)

    谷歌学者 

下载参考资料

作者信息

作者和附属机构

作者

通讯作者

与的通信陈世昌.

权利和权限

转载和许可

关于本文

引用这篇文章

华盛顿州钟。,林,惠普。,陈,SC。等。JackHare:使用MapReduce将SQL转换为NoSQL的框架。自动软件工程 21, 489–508 (2014). https://doi.org/10.1007/s10515-013-0135-x

下载引文

  • 收到以下为:

  • 认可的以下为:

  • 出版以下为:

  • 发布日期以下为:

  • DOI程序以下为:https://doi.org/10.1007/s10515-013-0135-x

关键词

导航