
Hadoop 运用 Apriori 算法。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Hadoop最初采用基于蛮力Apriori算法的实现方式。 然而,该算法并未进行关联规则的持续构建。 具体的运行参数包括:家庭输入、输出、最小支持度(minsup)以及最大迭代次数。 使用 `hadoop jar HadoopApriori.jar com.jgalilee.hadoop.apriori.driver.Driver input/apriori.state input/transactions.txt output 3 10 2` 命令执行时,每次迭代都能生成包含文件名和迭代状态路径的文件。 输入目录指定了交易数据的存储位置,输出目录则用于存储每个迭代过程 `n` 的结果,即 `output/n`。 此外,`minsup` 定义了频繁项集中的最小支持度阈值,而 `max` 参数控制了算法能够执行的最大迭代轮数。 我们假设输入数据集已经准备就绪。
全部评论 (0)
还没有任何评论哟~


