
基于FP-Growth的并行SON算法的实现方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文提出了一种基于FP-Growth的并行SON(序列模式)算法实现方法,有效提升了频繁序列模式挖掘的速度和效率。
传统的SON算法在单节点运行下可以有效降低CPU和I/O负载,并且只需对整个事务数据集进行两次扫描。然而,在阶段一发现局部频繁项集的过程中,采用的Apriori算法仍需多次扫描每个分区。基于此,我们深入研究了SON算法并根据MapReduce编程模型提出了一个基于FP-growth的并行化实现方案。实验结果表明,这种新的并行化方法不仅缩短了传统SON算法的运行时间,并且随着数据分区数量增加还能获得更好的加速比。
全部评论 (0)
还没有任何评论哟~


