
Apriori算法的数据挖掘详解及Python代码分享
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本篇文章详细解析了Apriori算法在数据挖掘中的应用,并提供了实用的Python代码示例,帮助读者深入理解与实践。
关联规则挖掘是数据挖掘领域中最活跃的研究方法之一,用于发现事物之间的联系,并最早应用于超市交易数据库中不同商品关系的分析。例如,在这类研究中可以发现啤酒与尿布之间存在的某种相关性。
支持度定义为:support(X–>Y) = |X交Y|/N=集合X和集合Y中的项在一条记录中同时出现的次数除以数据记录总数。比如,支持度(support({啤酒}–>{尿布}))就是啤酒和尿布在同一交易记录中共同出现的比例,计算方式为:3次(即两者同时出现在三条记录中)/5条总记录数 = 60%。
自信度定义如下:confidence(X–>Y) = |X交Y|/|X|=集合X与集合Y中的项在一条记录中同时出现的次数除以集合X单独出现的总数。例如,co
全部评论 (0)
还没有任何评论哟~


