
DouBanRecommend: 豆瓣图书推荐及知识图谱在Neo4j中的简易构建
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本教程介绍如何利用豆瓣API获取图书数据,并在Neo4j中构建知识图谱。适合对知识图谱和数据库操作感兴趣的读者。
DouBanRecommend项目基于豆瓣图书的推荐、知识图谱与知识引擎在neo4j上进行简单构建。该项目的主要贡献包括数据源(来自豆瓣爬虫)、知识图谱引擎以及嵌入式推荐算法的应用。主要目的是通过练习来提升技能,具体应用为豆瓣图书推荐和搜索模块,并结合Neo4j的知识库使用。
项目更新日期:2021年1月30日
- 更新内容包括将book_excel.csv压缩成book_excel.zip并放置在文件夹book_recomend中
一、数据整理:
对爬虫获取的数据进行简单处理,主要工作是针对每本书的评分和阅读人数字段(豆瓣书籍评分 + 书籍阅读人数)进行了等级划分,并计算平均值以得出该书的基本得分。
# 将豆瓣读书评分 / 豆瓣读书人群数量 进行分箱
book_excel_all[rank_rank] = pd.qcut(book_ex,此处代码未完整提供。
全部评论 (0)
还没有任何评论哟~


