
Apriori算法的经典标准代码实现,用于关联规则挖掘。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Apriori算法作为一种用于挖掘关联规则的频繁项集算法,其关键在于通过候选集生成以及情节的向下封闭检测这两个关键阶段,从而有效地提取频繁项集。该算法的核心在于,首先识别出所有满足预设最小支持度的项集,即那些具有足够频繁出现的特性的集合。随后,基于这些频繁项集,生成一系列强关联规则,并且这些规则必须同时满足最小支持度和最小可信度这两个条件。为了产生期望的规则,算法会利用先前识别出的频繁项集来构建包含单个元素的规则,其中右侧仅包含一项。具体而言,采用中规则的定义进行筛选。一旦这些关联规则被生成完成,则只保留那些超过用户设定的最小可信度的规则。为了全面地识别所有可能的频繁项集,算法采用了递归的方法。具体步骤包括:(1) L1 = find_frequent_1-itemsets(D);(2) for (k=2;Lk-1 ≠Φ ;k++) {(3) Ck = apriori_gen(Lk-1 ,min_sup);(4) for each transaction t ∈ D {//scan D for counts(5) Ct = subset(Ck,t);//get the subsets of t that are candidates(6) for each candidate c ∈ Ct(7) c.count++;(8) }(9) Lk ={c ∈ Ck|c.count≥min_sup}(10) }(11) return L= ∪ k Lk; 然而,Apriori算法在实践中也存在一些显著的缺点:可能产生大量的候选集,并且可能需要多次扫描数据库以完成任务。
全部评论 (0)
还没有任何评论哟~


