Advertisement

该数据集包含Twitter,一个基于社交网络的推荐系统章节。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
【数据信息】本数据集包含Twitter用户的详细信息,囊括了用户的各项属性、社交关系网络(circles)以及个人演化网络(egonetwork),并且已经通过严格的匿名化处理进行了保护。该数据集总共有81306位用户以及1768149条连接关系。 “nodeId.edges”:指用户nodeId在egonetwork中所有关联边的集合,其中nodeId作为该演化网络的核心节点。“nodeId.circles”:指用户nodeId所属的社交圈(circle),以及该社交圈内的所有其他成员。每一行数据都对应一个特定的社交圈,第一列元素代表社交圈的编号。“nodeId.feat”:此文件记录了在“nodeId.edges”文件中所有用户所拥有的属性特征。第一列元素为用户ID,后续列则分别对应不同维度的属性特征,1表示用户具备该属性,0则表示不具备。“nodeId.egofeat”:指用户nodeId自身的属性特征。“nodeId.featnames”:提供了属性特征的名称列表,例如教育背景、生日等信息。更为详细的信息则已进行隐藏处理。 【使用指南】建议参考J. McAuley, J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS 2012, pp. 539-547。 【原始数据来源】斯坦福大学网络分析平台

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Twitter.zip
    优质
    本数据集为研究Twitter上的用户行为和偏好而设计,包含大量经过标注的Twitter推荐信息,适用于社交媒体分析、个性化推荐算法开发等领域。 本数据集包含了Twitter用户的信息,并经过脱敏处理以保护隐私。该数据集包括用户的属性、社交圈(circles)以及ego网络(egonetwork)。共有81306个用户,涉及1768149条连边。 - **nodeId.edges**:文件中记录了每个节点ID的ego网络中的所有连接关系,其中该节点作为中心点。在Twitter上,关注关系是有方向性的,“a b”表示用户a关注b,并不意味着b也一定回关a。 - **nodeId.circles**:描述了每个用户的社交圈及其成员信息。每一行代表一个特定的社交圈子;第一列是该社交圈编号。 - **nodeId.feat**:此文件记录了出现在对应nodeId.edges中的所有用户属性特征,其中第一列为用户ID,其余各列为不同的属性维度,1表示拥有该属性,0则相反。 - **nodeId.egofeat**:提供每个节点的个人属性信息。 - **nodeId.featnames**:列出了各个属性名称及其类别。例如教育背景、生日等基本信息被列出但具体细节未公开。 引用文献为J. McAuley, J. Leskovec发表于NIPS 2012年的论文《Learning to Discover Social Circles in Ego Networks》(页码539-547)。数据集来源于斯坦福大学网络分析平台。
  • Twitter连接
    优质
    此数据集汇集了Twitter平台上的社交互动信息,包含用户间的关系与交流记录,为研究社交媒体影响及传播模式提供了宝贵的资源。 Twitter的社交网络连接数据集包含了用户之间的转发关系,可用于进行社交网络数据分析研究。
  • 与信息整合
    优质
    本研究探讨了社交网络中推荐系统的运作机制及其在信息整合方面的应用,旨在提高用户体验和内容匹配度。 总体环境和社会网络信息已成为推荐系统的重要数据来源。在推荐系统中整合这些信息将进一步提升系统的准确性和用户满意度。该算法通过随机决策树划分原始的用户-商品评分矩阵,将具有相似属性的数据归类到一起。然后利用这种分类方法来融合社交网络的信息,在考虑特定情境的前提下提出了一种结合社会关系网路的增强型推荐模型,并采用基于信任度的皮尔逊相关系数的方法进行处理。 通过在真实数据集上的实验验证显示,该系统相较于传统的基础推荐算法和单纯依赖于社会网络信息的推荐方法,在性能表现上有了显著的进步。
  • 优质
    本项目致力于构建和评估用于训练与测试推荐系统性能的数据集,涵盖用户行为、偏好分析等多维度信息,旨在促进个性化推荐算法的研究与发展。 使用Python的Suprise模块构建推荐算法模型,可以实现对电影、书籍等资源的个性化推荐。文中提到的数据集用于训练和测试该推荐系统。
  • 书籍好书
    优质
    本项目构建了一个智能书籍推荐系统,利用深度学习技术分析“Good Books”数据集,旨在为读者提供个性化、高质量的阅读建议。 使用奇异值分解(SVD)的书籍推荐系统会将评估矩阵分解为三个不同的矩阵:U、Sigma 和 Vt。通过计算这些矩阵的点积并生成大小为(number_of_users x number_of_books) 的用户配置文件矩阵,可以表示每个用户对不同图书的兴趣和评分情况。 项目目标包括: - 使用SVD技术来创建用户的个人资料,即形成一个表格(number_of_user x number_of_books)。 - 利用该用户配置文件矩阵推荐合适的书籍给读者。 - 设计友好的界面让使用者能够更新或建立自己的用户档案,并接收系统提供的图书推荐。 若要运行此推荐系统的数据库部分,请在Database.py中修改以下变量: - root_dir: 这样,您就可以基于SVD算法来优化用户的阅读体验并提供个性化的书籍建议了。
  • Flickr
    优质
    Flickr的社交网络数据集包含用户间连接和照片标签信息,为研究社交网络结构及图像内容提供了宝贵的资源。 Flickr是一个用户分享图片和视频的社交平台,在这个数据集中,每个节点代表一个Flickr用户,每条边表示两个用户之间的朋友关系。此外,每个节点都有标签来标识用户的兴趣小组。
  • 旅游平台—用户评论表
    优质
    该数据集为旅游社交平台的推荐系统提供支持,包含了丰富的用户评论信息,旨在帮助开发者更好地理解和分析用户的偏好与需求。 旅游社交平台与推荐系统数据集包含用户评论表和景点表。由于一次只能上传一个文件,所以景点表将放在下一个资源中。
  • Book Crossing
    优质
    本书推荐系统数据集旨在通过分析《Book Crossing》项目中的用户阅读行为,优化个性化书籍推荐算法,增强用户体验。 Book Crossing 是一个书籍推荐系统数据集,用于向用户推荐他们偏好的书籍。
  • Spark电影
    优质
    本数据集为构建于Apache Spark平台上的电影推荐系统所用,包含用户评分、电影信息等多维度数据,旨在优化个性化推荐算法。 基于Spark的电影推荐系统数据集主要用于开发和测试机器学习模型,特别是那些旨在改进用户个性化体验的应用程序。这个数据集包含了大量的电影评分、标签和其他相关信息,可以帮助开发者构建更加精准的推荐算法。通过利用Spark这样的大数据处理框架,可以有效地分析大量数据,并快速迭代优化推荐系统的性能。
  • 用户算法研究
    优质
    本研究聚焦于社交网络环境下的用户推荐算法,深入探讨了如何通过分析用户的在线行为数据,提升个性化内容和服务的推荐效果。 影响用户相信某个推荐结果的因素之一是朋友的推荐:90%的用户更倾向于信任朋友给出的意见。基于社交网络进行的产品或内容推荐能够很好地模拟现实社会中的互动方式,因此利用这些数据可以增强用户对系统的信任度。此外,通过分析用户在社交网络上的行为和偏好,还可以有效解决新用户的“冷启动”问题。