
中国科学院大学刘莹数据挖掘第二次作业.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该文档是《数据挖掘》课程在中国科学院大学的教学材料之一,内含学生刘莹完成的第二次作业内容及分析成果。
针对表1所示的数据集(最小支持度为60%,最小置信度为70%):
(a) 使用Apriori算法找出所有频繁项集,并将每个交易ID视为一个购物篮。
(b) 利用第(a)部分的结果计算关联规则{a, b}→{c}和{c}→{a, b}的置信度。置信度是对称测量吗?
(c) 根据以下元规则列出所有强关联规则(具有支持s和置信度c),其中X代表客户,itemi表示商品变量(例如“A”,“B”等)。
对于表1所示的数据集(最小支持度为60%):
(a) 使用FP-Growth算法找出所有的频繁项集,请展示所有FP树及条件模式基。
(b) 比较Apriori和FP-Growth的效率。
全部评论 (0)
还没有任何评论哟~


