Advertisement

spark-distributed-louvain-modularity:基于Spark的分布式Louvain模块化算法...

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
spark-distributed-louvain-modularity 是一个利用Apache Spark实现的大规模图数据社区发现工具,采用高效的Louvain模块化算法进行分布式计算。 dga-graphX 是一个软件包,它使用GraphX框架在Spark平台上构建了几种预构建的可执行图算法。 前提条件: - Spark 0.9.0 或更高版本 - GraphX 如果需要,请编辑build.gradle文件以设置您的Spark和GraphX版本。通过运行 `gradle clean dist` 来生成dga-graphx软件包,可以在build/dist文件夹中找到dga-graphx-0.1.jar。 算法: 鲁汶分布式社区检测是Fast unfolding of communities in large networks这篇文章的并行实现:Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • spark-distributed-louvain-modularity:SparkLouvain...
    优质
    spark-distributed-louvain-modularity 是一个利用Apache Spark实现的大规模图数据社区发现工具,采用高效的Louvain模块化算法进行分布式计算。 dga-graphX 是一个软件包,它使用GraphX框架在Spark平台上构建了几种预构建的可执行图算法。 前提条件: - Spark 0.9.0 或更高版本 - GraphX 如果需要,请编辑build.gradle文件以设置您的Spark和GraphX版本。通过运行 `gradle clean dist` 来生成dga-graphx软件包,可以在build/dist文件夹中找到dga-graphx-0.1.jar。 算法: 鲁汶分布式社区检测是Fast unfolding of communities in large networks这篇文章的并行实现:Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre。
  • Louvain Algorithm: 实现Louvain
    优质
    本项目实现了Louvain算法,用于社区检测。通过优化模块度,高效识别网络中的社团结构,适用于大规模图数据集分析。 Louvain算法的实现可以在论文《大型网络中社区的快速展开》(Vincent D Blondel、Jean-Loup Guillaume、Renaud Lambiotte、Etienne Lefebvre,Journal of Statistical Mechanics: Theory and Experiment 2008 (10), P10008)中找到详细信息。使用此程序时,输入数据格式应与SNAP的数据集相同。
  • Python-Louvain-0.14_Louvain_Python-Louvain包_Louvain-python
    优质
    简介:Python-Louvain-0.14是一个用于实现Louvain社区检测算法的Python包。该库提供高效且易于使用的接口,适用于复杂网络分析和社交网络研究中寻找最优模块化分群结构。 使用Python实现社区分类的Louvain算法。
  • LouvainJava实现
    优质
    Louvain算法的Java实现介绍了一种高效的社区检测算法在Java编程语言中的具体实践。该算法能够有效地识别复杂网络结构中紧密相连的小群体,对于社交网络分析、生物学研究等领域具有重要意义。此项目提供了Louvain算法的标准Java库和示例代码,便于开发者集成到自己的应用中进行社群发现与数据分析。 Louvain社区发现算法的运算速度非常快,因为它只需要计算相邻节点在社区变换Q中的变化值,并采用贪婪优化策略。
  • LouvainMatlab实现版本
    优质
    本简介介绍了一种基于Matlab编程环境实现的Louvain社区检测算法。该工具能够高效地进行大规模网络数据中的社群结构分析。 Louvain算法的Matlab版本提供了一种高效的方法来识别网络中的社区结构。此实现基于Modularity优化原则,并且适用于大规模复杂网络分析。该代码易于使用并可以根据具体需求进行调整,为研究人员和工程师在社交网络、生物信息学及其它领域提供了强大的工具。
  • Matlab时代码-GenLouvain:MATLAB通用Louvain社区划
    优质
    Matlab分时代码-GenLouvain是一款在MATLAB环境下运行的程序,它实现了通用版的Louvain社区检测算法,适用于网络分析中发现模块化结构。 matlab分时代码GenLouvain版本2.2于2019年7月发行,请引用此代码,例如:LucasGSJeub, MaryaBazzi, InderjitS.Jutla 和 PeterJ.Mucha,“在MATLAB中实现的用于社区检测的通用Louvain方法”,(2011-2019年)。 内容说明: 该软件包包含主要的genlouvain.m文件,此文件调用了许多作为mex函数实现的子例程。这些mex函数的源代码位于“MEX_SRC”目录中。此外,专用目录里包括针对64位Mac、Windows和Linux系统的预编译可执行文件。“HelperFunctions”目录包含用于计算模块化矩阵和后处理分区的辅助函数。其中,后处理功能使用了MarkusBuehren的代码(该代码位于“Assignment”目录中)来解决最佳分配问题。 安装说明: 确保GenLouvain文件夹及其所有子文件夹在MATLAB路径中。
  • Spark-Apriori: Spark Apriori 实现
    优质
    Spark-Apriori是一款利用Apache Spark高效处理大数据集的Apriori算法实现。该工具旨在发掘大规模数据中的频繁项集和关联规则,为市场篮分析提供强大支持。 火花先验使用 Spark 的蛮力 Apriori 算法实现,并且该算法不会继续生成关联规则。用法如下: 输入参数包括最大迭代次数、最小支持度和分区数量。 命令行示例: ``` spark-submit \ --class com.jgalilee.spark.apriori.JobDriver \ --master local[4] \ ./target/scala-2.10/spark-apriori_2.10-1.0.jar \ input/transactions.txt \ 10 \ 3 \ output \ 3 ``` 参数说明: - `input` - 输入交易数据的路径。 - `max` - 要运行的最大迭代次数。 - `minsup` - 作为频繁项集候选项的标准最小支持度阈值。 - `output` - 输出结果存放的位置,即输出目录为 output/n - `partitions` - 用于事务数据集划分的分区数量。
  • Louvain高效社区检测(Fast Unfolding方
    优质
    Louvain算法是一种高效的社区发现方法,通过优化模块度来识别网络中的社团结构。该方法因其计算速度快和效果好而被广泛应用于复杂网络分析中。 目前社区发现算法中最快速的算法是由Vincent D.Blondel等人在2008年提出的,该算法基于modularity optimization启发式方法,并且其代码可以直接使用,在Vincent D.Blondel个人官网上可以找到相关资源。
  • Hadoop与Spark集群构建及Spark程序实例.doc
    优质
    本文档详细介绍了Hadoop和Spark的分布式集群搭建流程,并通过具体的Spark编程案例讲解了如何利用Spark进行数据处理。 本段落介绍如何搭建Hadoop与Spark的分布式集群,并提供了一个使用二项逻辑斯蒂回归进行二分类分析的例子程序以及一个简单的求平均值程序。这两种示例展示了不同的运行方式。
  • distributed-jacobi: OpenMPI 线性方程组 Jacobi
    优质
    distributed-jacobi 是一个利用 OpenMPI 实现的分布式计算项目,专注于通过Jacobi迭代法高效解决大规模线性方程组问题。 Jacobi 方法的分布式实现使用 OpenMPI 来求解线性方程组。该项目旨在比较算法在不同变量、内核数量和线程数下的串行、并行及分布式实现方式,探讨它们如何扩展以及速度与效率的表现情况。通过这个项目,你可以发现:OpenMPI 实现的具体测试数据和其他相关信息。