Advertisement

包含超过12万用户的豆瓣电影数据集,以及40万多个影评,并附带一个爬虫程序压缩包。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该程序采用Python编程语言构建,并具备豆瓣电影数据的搜索与下载功能,同时提供包含数据文件及完整源代码的资源包,方便用户直接使用和进一步开发。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 1240.zip
    优质
    本资源包含一个用于收集豆瓣电影评论数据的Python爬虫程序,可获取12万用户超过40万条评论的数据集。适合进行数据分析和机器学习研究使用。 使用Python语言实现的豆瓣电影数据搜索下载程序,包含数据文件和源代码。
  • 12+40+推荐系统
    优质
    本项目提供一个全面的豆瓣电影数据集,涵盖超过12万名用户的40余万条评论。附带的爬虫程序可轻松获取最新数据,适用于构建个性化推荐系统和数据分析研究。 我们有一个包含12万条豆瓣电影相关数据集和40万条评论的数据资源,这些评论来自用户对电影的评价。此外,还有一个通过爬虫程序收集的数据集合,包括两个CSV文件和一个数据库(db)。这个数据已经采集了几天时间,并且可以用于构建推荐系统。希望这能为大家提供帮助。
  • 12+40+论)推荐系统
    优质
    本项目包含一个庞大的豆瓣电影评论数据库,涉及超过12万名用户的40多万条评论。此外还提供了一个用于收集和分析这些评论的推荐系统爬虫程序。该数据集为研究用户行为、情感分析以及个性化推荐算法提供了宝贵资源。 最近在学习爬虫技术,经过几天的努力,我成功地从豆瓣电影数据集中抓取了12万+用户及40万+影评的数据,并将其整理为两个csv文件和一个db数据库。这个数据集非常适合用于构建推荐系统。 如果觉得这些资源对你有帮助,请考虑给我评论并打个五星好评哦!
  • 40论).xlsx
    优质
    本文件为豆瓣电影用户评论数据集合,包含超过40万条影评记录,每条评论均标注了评分、时间及具体内容,是研究用户观影偏好与评论文本分析的重要资源。 豆瓣电影用户评论数据包含40万条记录,每条评论包括以下字段:id、time(评论时间)、movieId(电影ID)、rating(评分)、content(评论内容)、creator(创建者)、addTime(添加时间)。
  • 5
    优质
    本数据集包含了来自豆瓣网站的五万余条电影评论,旨在为研究者提供一个全面且丰富的中文语料库,用于情感分析、主题建模等自然语言处理任务。 我收集了豆瓣5万条影评的原始数据集,欢迎大家下载并尊重我的劳动成果。如果有时间我会继续提供更多的数据集。对于从事机器学习、自然语言处理和深度学习的研究者来说,这个资源非常有用。数据格式为:电影名称##评论星级(1-5星)##评论内容。
  • 20.txt
    优质
    该数据集包含豆瓣电影平台上超过20万条用户评论,内容涵盖各类电影,为研究者提供丰富的文本分析素材,适用于情感分析、主题建模等领域。 我收集了一个包含20万条豆瓣影评的原始数据集,并希望大家分享。请尊重我的劳动成果。对于对机器学习、自然语言处理和深度学习感兴趣的朋友来说,这份资料非常有用。数据集中每一行记录格式为:电影名称##评论星级(1-5星)##评论内容。
  • 优质
    本书汇集了网友对众多电影的评论精华,从六万余条评论中精选而出,涵盖了各种类型的影片,为影迷提供了一个深入了解和探讨电影艺术的独特视角。 爬虫获取的豆瓣电影短评包括了电影名、用户名、日期、评分以及短评内容。
  • Top250
    优质
    本程序为豆瓣Top250电影信息自动化采集工具,可高效抓取包括影片名称、评分、短评等关键数据,便于后续分析与应用。 实现豆瓣电影Top250条信息的爬取任务包括获取每部电影的链接、图片链接以及详细信息,并将这些数据保存为Excel和SQLite数据库。
  • 10条目.zip
    优质
    本数据集包含超过十万部电影的相关信息和用户评价,是进行数据分析、推荐系统研究的理想资源。 豆瓣爬虫用于收集10万条电影数据集、用户数据集以及影评数据集。
  • TOP250
    优质
    本项目为一款用于抓取豆瓣TOP250电影信息的爬虫工具,涵盖影片名称、评分、评论等数据,便于用户分析和研究。 纯手写的豆瓣电影爬虫。没有使用BeautifulSoup,而是采用了纯字符串搜索的方法。