
Spark-Apriori 利用 Spark 算法。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
火花先验采用 Spark 强大的 Apriori 算法进行关联规则挖掘。 此算法不再进行后续的关联规则构建。 使用方法涉及向系统输入最大支持度阈值,并指定输出分区以及 Spark 提交参数。 具体而言,使用 `spark-submit` 命令执行类 `com.jgalilee.spark.apriori.JobDriver`,指定本地环境运行 `./target/scala-2.10/spark-apriori_2.10-1.0.jar` 文件,并提供输入交易文件路径 `input/transactions.txt`、最大迭代次数 `10`、最小支持度阈值 `3` 以及输出路径 `output`。 此外,`-3input` 参数定义了输入交易数据的路径,`-max` 指定了最大迭代次数,`-minsup` 定义了作为频繁项集考虑的最小支持度,而 `-output` 则表明为每个迭代步骤写入输出路径,即 `output/n`,该路径用于存储迭代 n 的数据集分区。 假设输入数据已被预处理。
全部评论 (0)
还没有任何评论哟~


