Advertisement

豆瓣电影数据(id、片名、链接地址、评分、海报等)共13万条,未去重(去重后约12万)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据库收录了超过13万条豆瓣电影的数据记录,涵盖影片ID、名称、详情页链接、观众评分及高清海报图片等内容。尽管数据总量庞大,但经过筛选去重后可精简至约12万个独立项目,为影迷与研究者提供了丰富的信息资源和便捷的检索体验。 经过两天的努力,我爬取了豆瓣上的电影数据。在去重之前有13万多条记录,而去重后剩下大约12万条记录。辛苦的工作终于有了成果。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • (id)1312
    优质
    本数据库收录了超过13万条豆瓣电影的数据记录,涵盖影片ID、名称、详情页链接、观众评分及高清海报图片等内容。尽管数据总量庞大,但经过筛选去重后可精简至约12万个独立项目,为影迷与研究者提供了丰富的信息资源和便捷的检索体验。 经过两天的努力,我爬取了豆瓣上的电影数据。在去重之前有13万多条记录,而去重后剩下大约12万条记录。辛苦的工作终于有了成果。
  • 集(id, 标题, 连, , 演员, 导演...) 12W+ (已)
    优质
    这是一个包含12万条以上独特记录的豆瓣电影数据集,每部影片的信息包括ID、标题、链接、评分及主要演员和导演等详细信息。 豆瓣电影数据包含12万多个条目(已去重),格式为json,包括字段:id、标题、连接地址、评分、演员、导演等。
  • 优质
    本书汇集了网友对众多电影的评论精华,从六万余条评论中精选而出,涵盖了各种类型的影片,为影迷提供了一个深入了解和探讨电影艺术的独特视角。 爬虫获取的豆瓣电影短评包括了电影名、用户名、日期、评分以及短评内容。
  • 集(含12用户40)爬虫程序.zip
    优质
    本资源包含一个用于收集豆瓣电影评论数据的Python爬虫程序,可获取12万用户超过40万条评论的数据集。适合进行数据分析和机器学习研究使用。 使用Python语言实现的豆瓣电影数据搜索下载程序,包含数据文件和源代码。
  • 20论的集.txt
    优质
    该数据集包含豆瓣电影平台上超过20万条用户评论,内容涵盖各类电影,为研究者提供丰富的文本分析素材,适用于情感分析、主题建模等领域。 我收集了一个包含20万条豆瓣影评的原始数据集,并希望大家分享。请尊重我的劳动成果。对于对机器学习、自然语言处理和深度学习感兴趣的朋友来说,这份资料非常有用。数据集中每一行记录格式为:电影名称##评论星级(1-5星)##评论内容。
  • 截至2020年2月底的12以上,精准且无
    优质
    该数据库收集并整理了超过12万条豆瓣用户在2020年2月以前对电影的评分与评论信息,确保每一部作品的数据真实可靠、独一无二。 花费20元采用两种方法采集数据:一是通过豆瓣电影ID进行采集;二是利用CMS影视名字搜索并结合站内其他用户以往的评分记录。总计收集了12万条数据,时间截至到2020年2月20日。
  • 包含5
    优质
    本数据集包含了来自豆瓣网站的五万余条电影评论,旨在为研究者提供一个全面且丰富的中文语料库,用于情感分析、主题建模等自然语言处理任务。 我收集了豆瓣5万条影评的原始数据集,欢迎大家下载并尊重我的劳动成果。如果有时间我会继续提供更多的数据集。对于从事机器学习、自然语言处理和深度学习的研究者来说,这个资源非常有用。数据格式为:电影名称##评论星级(1-5星)##评论内容。
  • 用户集(40论).xlsx
    优质
    本文件为豆瓣电影用户评论数据集合,包含超过40万条影评记录,每条评论均标注了评分、时间及具体内容,是研究用户观影偏好与评论文本分析的重要资源。 豆瓣电影用户评论数据包含40万条记录,每条评论包括以下字段:id、time(评论时间)、movieId(电影ID)、rating(评分)、content(评论内容)、creator(创建者)、addTime(添加时间)。
  • 集10目.zip
    优质
    本数据集包含超过十万部电影的相关信息和用户评价,是进行数据分析、推荐系统研究的理想资源。 豆瓣爬虫用于收集10万条电影数据集、用户数据集以及影评数据集。
  • 集10(Film版).zip
    优质
    本资源为豆瓣电影数据集10万条(Film版).zip,内含丰富详尽的电影信息,涵盖片名、导演、演员表等多维度数据。适合数据分析与机器学习研究使用。 豆瓣电影Film数据集包含10万条记录。