本项目实现了三种经典关联规则学习算法(Apriori、FP-Growth及Eclat)的Python代码,用于高效地进行数据集中的频繁项集与关联规则挖掘。
基于Apriori、FP-Growth及Eclat算法的频繁模式挖掘源程序
一、DataMiningApriori程序:
使用eclipse打开该程序,并将测试数据mushroom、accidents和T10I4D100K放置在F:\DataMiningSample\FPmining文件夹下,即可运行。
二、FP-growth程序
包括源代码文件及编译生成的可执行文件。使用方法如下:把FP_Growth.exe与三个测试数据mushroom、accidents和T10I4D100K放置在同一目录内,双击FP_Growth.exe可以顺序挖掘这三个测试数据集中的频繁模式,阈值设定请参考testfpgrowth.cpp文件的main函数。
三、Eclat程序
直接使用eclipse打开并执行该程序即可运行。
四、输出结果说明:
示例提供了一部分输出文件。由于全部输出体积过大,未完全展示所有内容。可以通过执行相应程序获得完整的输出频繁模式及支持度信息,并附有详细解析的PPT文档供参考。