Advertisement

社区发现常用数据集..

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据集合集涵盖了广泛用于社区检测研究中的网络结构和属性信息,旨在促进算法开发与性能评估。 需要一个包含football关键字的文件以及空手道俱乐部karate的相关数据。此外还需要海豚Dolphin的数据和一个具有4000个节点的稍大网络的txt与gml格式文件。其中,txt文件有两种不同的格式。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • ..
    优质
    本数据集合集涵盖了广泛用于社区检测研究中的网络结构和属性信息,旨在促进算法开发与性能评估。 需要一个包含football关键字的文件以及空手道俱乐部karate的相关数据。此外还需要海豚Dolphin的数据和一个具有4000个节点的稍大网络的txt与gml格式文件。其中,txt文件有两种不同的格式。
  • 优质
    本数据集专为社区发现设计,包含多类型网络结构与标签信息,适用于算法评估及模型训练,助力挖掘复杂系统中的社群模式。 压缩包包含了多个社区发现的公开数据集:karate、football、power、polbooks、polblogs、lesmis、dophins、celegansneural和adjnoun。希望这些数据能对你有所帮助。
  • Copra算法与
    优质
    Copra社区发现算法与数据集是一款专为研究社交网络结构而设计的工具,提供了多种算法用于识别和分析网络中的社区组织模式。 本资源包含社区发现的copra算法代码的Python实现版本,但存在一些小问题可供大家评论讨论。在现有数据集上该代码可以正常运行,大家可以放心下载。
  • 真实网络_Karate Club和football网络_football_与网络分析.rar
    优质
    本资料包含Karate Club及Football两个经典的真实世界网络数据集,适用于社区发现、社团结构分析等研究。含案例解析与代码实现,助力深入学习网络数据分析技术。 在社区发现领域的实验研究中,常用的真实网络数据集包括football club、dolphins、karate和polbooks。
  • LFM算法的重叠Python源码及
    优质
    本项目提供基于LFM(标签特征矩阵)算法的Python代码实现,用于在复杂网络中识别和挖掘重叠社区结构,并包含相关测试数据集。 LFM算法来源于论文《Detecting the Overlapping and Hierarchical Community Structure in Complex Networks》。文档包含该算法的Python源码及所需数据集,仅供学习参考。
  • 检测测试
    优质
    该数据集专为社区检测算法设计,包含多种网络结构与规模的真实世界及合成数据,旨在评估并比较不同算法在识别社群结构方面的效能。 该研究包含了真实网络数据集和benchmark数据集。在benchmark数据集中,社区规模分别为1000、2000和5000;社区混合系数u的取值范围为0.1到0.8。
  • 重叠划分
    优质
    本文探讨了在重叠社区结构中有效划分数据集的方法,旨在提高机器学习模型的性能和泛化能力。 在社交网络分析领域,重叠社区划分是一个重要的概念,与传统的非重叠社区划分不同,它反映了节点可以同时属于多个社区的现实情况。此数据集包含多种经典网络,如“football”(美国大学橄榄球联盟)和“karate”(卡特武术俱乐部),用于研究和测试重叠社区检测算法。 以“football”为例,该数据集基于美国大学间的橄榄球比赛记录构建而成,每个节点代表一个球队,边则表示两队之间的比赛。由于球队间可能存在多种关系,如联盟内赛程、友谊赛等,这体现了社区的重叠性。通过分析这种网络结构可以识别出具有相似比赛模式的团队群体,并进一步理解它们间的竞争与合作关系。 另一个经典案例是“karate”数据集,它记录了70年代某个武术俱乐部成员间的关系网。每个节点代表一位会员,边则表示他们之间的互动情况。由于人际关系复杂多变,同一会员可能同时参与多个小团体的活动,从而形成重叠社区结构。对这种网络进行分析有助于揭示该组织内部的社会关系和动态变化。 面对重叠社区划分挑战时,需要采用特殊策略以有效识别这些交集部分,而不是仅依赖于传统的二元分类方法。常见的算法包括Blondel Louvain 方法、Girvan-Newman 层次聚类法、标签传播算法(Label Propagation)以及基于图谱流的算法等。虽然这些技术在处理非重叠社区时表现良好,但在应对重叠结构时则需要额外考虑如引入概率模型或允许节点权重分配于多个社区之间的策略。 评估重叠社区划分效果的关键指标包括NMI(标准化互信息)、F-score、精确度和召回率。通过使用交叉验证或者利用不同的随机种子重复实验等方式来确保结果的稳定性和可复制性,可以帮助研究者更好地理解和比较不同算法的表现。此外,将实验结果可视化为节点-社区分布图可以直观展示社区结构及其重叠情况,并便于进一步分析讨论。 此“重叠社区划分数据集”提供了丰富的素材供学者深入探索社交网络中复杂多样的社群结构特征,推动相关检测技术的发展和完善。
  • 检测:football示例
    优质
    football数据集是用于社群结构分析的经典案例,包含11个重叠社团的网络拓扑结构,广泛应用于社区检测算法的研究与验证。 用于社区发现算法测试的公共数据集是football联赛数据集,这是大家公认的数据集。
  • 识别:dolphins+jazz+zachary+......
    优质
    本数据集包含多个经典的社会网络实例,如 dolphins、jazz 和 zachary 等,旨在研究和分析社区结构与识别算法。 自己整理的几个有/无监督数据集主要包括:celegans_metabolic、dolphins、football(115)、football(180)、Hitech、jazz、polblogs、polbooks、strike以及zachary(部分包含coordinate坐标文件)。