FPGrowth-Python项目旨在通过Python实现高效的频繁模式增长算法(FPGrowth),用于数据集中频繁项集和关联规则的高效挖掘,助力数据分析与机器学习应用。
FPGrowth-python实现
此实现基于特定框架。
输入文件格式:
python脚本接受以下格式的输入文件:
f,c,a,m,p
f,c,b
或者
f c a m p
f c a
如何使用:
首先使main.py可执行。
chmod +x main.py
运行FP-Growth算法:
.main input_file minsup minconf
输出:
该程序首先打印频繁模式:
{ 频繁项集 } (支持度)
例如。
{ a } ( 3 )
{ a c } ( 3 )
{ a c f } ( 3 )
{ a f } ( 3 )
之后它会打印规则。