野兔

JackHare:一个使用MapReduce实现SQL到NoSQL转换的框架。近年来,随着数据挖掘技术的迅速发展,数据存储和数据处理在提取重要信息方面越来越受到重视。无论是在关系数据库系统还是新兴的NoSQL数据库中,寻找一种可扩展的解决方案来处理大规模数据是一个关键问题。由于Hadoop固有的可扩展性和容错性,MapReduce对海量数据的并行处理具有很大的吸引力。以往的研究大多集中在利用Hadoop分布式文件系统开发SQL或类SQL查询转换器。然而,在这样的文件系统中很难频繁地更新数据。因此,我们需要一个灵活的数据存储系统作为HBase,不仅可以将数据存储在横向扩展存储系统上,而且可以透明地处理变化的数据。但是,HBase接口对大多数用户来说不够友好。一个由SQL客户端应用程序和数据库连接组成的GUI将简化学习过程。本文提出了一种结合SQL查询编译器、JDBC驱动程序的JackHare框架,以及利用MapReduce框架对HBase中的非结构化数据进行处理的系统化方法。在将JDBC驱动程序导入到SQL客户机GUI之后,我们可以利用HBase作为底层数据存储来执行ANSI-SQL查询。实验结果表明,我们的方法具有良好的效率和可扩展性。