
通过Python中的Apriori算法,可以进行频繁模式挖掘。 此外,它还能从频繁项目集中提取...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
#frequentPattern.py利用Apriori算法,生成从vocab.txt和topic-i.txt文件到patterns / pattern-i.txt目录下的频繁项目集。 此外,该程序还包含一个将术语映射到索引的字典,存储在vocab.txt文件中。 该文件的格式为:索引词列以制表符分隔。 紧接着,topic-i.txt文件作为频繁模式挖掘算法的输入,每行记录一个包含术语索引的交易。 其格式为:term1_index term2_index term3_index ...,各个术语索引之间用空格分隔。 最后,频繁模式挖掘算法将结果写入pattern-i.txt文件,每行代表一个交易,其中频繁的项目集按照支持计数由高到低排列。 该文件的格式为:support_count term1 term2 ... ,support_count和term1之间用制表符分隔,而术语之间则用空格分隔。 建议topic-i.txt和vocab.txt文件与frequentPattern.py保持一致。
全部评论 (0)
还没有任何评论哟~


