计算机工程与应用››2017,第53卷››发行(13): 95-98.内政部:10.3778/j.issn.1002-8331.1607-0127

大数据与云计算 • 上一篇   下一篇

基于Hadoop公司的中医哮喘用药组合关联分析

陈亚楠,朱习军  

  1. 青岛科技大学,山东 青岛 266061
  • 出版日期:2017-07-01 发布日期:2017-07-12

基于Hadoop的中医哮喘药物组合关联分析

陈亚南、朱希军  

  1. 青岛科技大学,中国山东青岛266061
  • 在线:2017-07-01 出版:2017-07-12

摘要:

针对传统平台运行阿普里奥里算法来挖掘中医病案中用药组合规律时,存在着占用内存空间大、计算效率低和PB(聚丁二烯)级数据无法处理等问题,提出基于Hadoop公司的中医哮喘用药组合关联分析方法。采用Mapreduce公司分布式计算框架和HBase(HBase)分布式数据库优化Apriori公司算法性能:一方面使用Mapreduce公司计算框架并行处理数据,借助HBase(HBase)高速读写数据的特性,加速频繁项集的产生;另一方面摒弃传统算法中的自连接产生候选项集方式,对每个节点上的数据,使用循环和递归相结合的方式产生候选集,提高候选集产生的效率。实验结果证明,借助基于Hadoop公司的中医哮喘用药组合关联分析方法挖掘中医药组合规律,效率更高,能更有效地指导临床实践。

关键词: 阿普里奥里, MapReduce、, 哮喘用药组合, HBase方法

摘要:在运行Apriori算法挖掘中医哮喘药物组合规则的传统平台上,存在着占用内存空间大、计算效率低、无法处理PB字节数据等问题。因此,本文提出了基于Hadoop挖掘中医药治疗哮喘药物关联性的分析方法。利用Mapreduce分布式计算框架和HBase分布式数据库优化Apriori算法性能:一方面利用Mapreducte计算框架并行处理数据,结合HBase高速读写数据的特点,加快频繁项目集的生成;另一方面?放弃了传统算法生成候选集的自连接方式。采用循环和递归相结合的方式为每个节点的数据生成候选集,提高了候选集的生成效率。实验表明,利用Hadoop平台挖掘哮喘中医药的组合用药,具有更高的效率,可以更有效地指导临床实践。

关键词: Apriori算法, MapReduce计算框架, 哮喘药物组合, HBase分布式数据库