Advertisement

截至2020年2月底的豆瓣电影评分,共计12万以上,数据精准且无重复

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该数据库收集并整理了超过12万条豆瓣用户在2020年2月以前对电影的评分与评论信息,确保每一部作品的数据真实可靠、独一无二。 花费20元采用两种方法采集数据:一是通过豆瓣电影ID进行采集;二是利用CMS影视名字搜索并结合站内其他用户以往的评分记录。总计收集了12万条数据,时间截至到2020年2月20日。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 2020212
    优质
    该数据库收集并整理了超过12万条豆瓣用户在2020年2月以前对电影的评分与评论信息,确保每一部作品的数据真实可靠、独一无二。 花费20元采用两种方法采集数据:一是通过豆瓣电影ID进行采集;二是利用CMS影视名字搜索并结合站内其他用户以往的评分记录。总计收集了12万条数据,时间截至到2020年2月20日。
  • 2020210收集完毕
    优质
    本项目汇集了截至2020年2月豆瓣电影平台上获得超过十万观众评价的数据,旨在为研究者提供一个全面且深入的用户偏好分析工具。 我已经下载并更新了数据至2020年2月,表格中的内容只有电影名和评分。数据已经提供给你们,如何使用是你们的事。反正我的影视数据评分已经更新了。
  • 集(20193
    优质
    这是一个包含大量中国影迷在豆瓣上对电影评价的数据集合,记录了截止至2019年3月的相关信息。 豆瓣电影数据集(截至2019年3月)包含91369条记录。每一条记录包括[电影名称、评分、评价人数、各星级占比、短评数量、影评数量、类型、导演、编剧、主演、制片国家/地区、语言、上映日期、片长和剧情简介]等信息。
  • (id、片名、链接地址、、海报等)13条,未去(去后约12
    优质
    本数据库收录了超过13万条豆瓣电影的数据记录,涵盖影片ID、名称、详情页链接、观众评分及高清海报图片等内容。尽管数据总量庞大,但经过筛选去重后可精简至约12万个独立项目,为影迷与研究者提供了丰富的信息资源和便捷的检索体验。 经过两天的努力,我爬取了豆瓣上的电影数据。在去重之前有13万多条记录,而去重后剩下大约12万条记录。辛苦的工作终于有了成果。
  • 集(含12用户40)爬虫程序.zip
    优质
    本资源包含一个用于收集豆瓣电影评论数据的Python爬虫程序,可获取12万用户超过40万条评论的数据集。适合进行数据分析和机器学习研究使用。 使用Python语言实现的豆瓣电影数据搜索下载程序,包含数据文件和源代码。
  • 优质
    该数据集包含了用户在豆瓣电影平台上为各类影片打分及撰写评论的信息,是研究电影评价和用户偏好的宝贵资源。 豆瓣电影评分数据可以从豆瓣获取,并用于推荐电影。
  • 优质
    本书汇集了网友对众多电影的评论精华,从六万余条评论中精选而出,涵盖了各种类型的影片,为影迷提供了一个深入了解和探讨电影艺术的独特视角。 爬虫获取的豆瓣电影短评包括了电影名、用户名、日期、评分以及短评内容。
  • 集(20193).xlsx.zip
    优质
    本数据集包含豆瓣电影信息,涵盖评分、评论量等指标,旨在为研究者和开发者提供一个全面的数据资源,适用于数据分析与机器学习模型训练。 豆瓣电影数据集(截至2019年3月),包含91369条记录。每条记录包括[电影名称,评分,评价人数,各星级占比,短评数量,影评数量,类型,导演,编剧,主演,制片国家/地区,语言,上映日期,片长,网址,剧情简介]等信息。
  • 20集.txt
    优质
    该数据集包含豆瓣电影平台上超过20万条用户评论,内容涵盖各类电影,为研究者提供丰富的文本分析素材,适用于情感分析、主题建模等领域。 我收集了一个包含20万条豆瓣影评的原始数据集,并希望大家分享。请尊重我的劳动成果。对于对机器学习、自然语言处理和深度学习感兴趣的朋友来说,这份资料非常有用。数据集中每一行记录格式为:电影名称##评论星级(1-5星)##评论内容。
  • 预测
    优质
    本数据集旨在通过搜集各类用户对电影的评价信息来构建模型,精准预测电影在豆瓣平台上的评分情况。 我们有一个来自豆瓣的电影数据集(约有1万多条记录),其中包括了电影名称、导演、编剧、演员、类型、票房收入以及评分等信息。以这些数据为基础,并将电影评分为标签值,我们可以预测未来新上映电影的预期评分。如果有兴趣的同学,请加入进来一起分享思路和想法,谢谢!