
Apriori及其改进:在Python中的实现(包含PCY和多Hash...)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了Apriori算法及其实现改进版(PCY, 多Hash等)的方法,并提供了基于Python语言的具体实现代码。
Apriori及其改进算法在Python中的实现问题:请使用单个哈希函数来实现PCY算法,并打印出所有频繁项集。输入参数包括:
- Input.txt:该文件包含所有的事务,其中每行代表一个单独的交易事项。
- 支持度(support): 用于定义哪些项目集合可以被认定为“频繁”的整数值。
- 存储桶大小(bucket size):这是哈希表的尺寸。
输出应包括所有按字典顺序排列、且符合给定支持度阈值的所有项目的项集。此外,如果存在任何大小大于等于2的频繁项集,则还需打印出每个候选项目在各个存储区内的计数情况。
示例输出如下:
```
[a, b, d] {0: 0, 1: 2, 3: 5}
[[a, b]]
```
这里,`[a,b,d]`表示一个频繁项集;而 `{0:0,1:2,3:5}` 则展示了不同存储区内的候选项目计数值。
全部评论 (0)
还没有任何评论哟~


