PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法
【出 处】:
【作 者】:
肖文
胡娟
周晓峰
【摘 要】频繁模式挖掘是最重要的数据挖掘任务之一,传统的频繁模式挖掘算法是以“批处理”方式执行的,即一次性对所有数据进行挖掘,无法满足不断增长的大数据挖掘的需要.MapReduce是一种流行的并行计算模式,在并行数据挖掘领域已得到了广泛的应用.将传统频繁模式增量挖掘算法CanTree向MapReduce计算模型进行了迁移,实现了并行的频繁模式增量挖掘.实验结果表明,提出的算法实现了较好的负载均衡,执行效率有明显提升.
相关热词搜索: 数据挖掘 频繁模式挖掘 增量挖掘 MapReduce Hadoop PFP
上一篇: 容错处理器阵列的多逻辑列并行重构算法
下一篇: 基于模型和库的处理器伪随机激励生成器设计与实现