
招聘岗位:爬虫与数据分析 内容概述: 1. 爬虫开发:运用Scrapy分布式爬虫框架,结合MongoDB数据库...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本职位专注于使用Scrapy和MongoDB进行高效的数据抓取及存储,同时负责分析复杂数据集以支持业务决策。要求具备Python编程能力和数据分析技能。
招聘爬虫+数据分析项目介绍:
1. 爬虫:采用Scrapy 分布式爬虫技术,并使用mongodb作为数据存储工具来抓取网站上的信息(例如51job)。目前,已经获取了几万条记录。
2. 数据处理:利用pandas对采集的数据进行清理和预处理工作。
3. 数据分析:通过flask后端从mongodb数据库中提取所需的信息,在前端则使用bootstrap、echarts以及D3来展示词云图等数据可视化效果。
注意事项:
1. pymongo的版本应为2.8或更低,可通过命令`pip install pymongo==2.8`进行安装。
2. 若Scrapy无法正常安装,请先安装相应版本的twisted库再尝试。
关于项目启动爬虫的具体步骤如下:
1. 进入项目的文件夹目录下;
2. 使用命令 `pip install pymongo==2.8` 安装指定版本的pymongo。
全部评论 (0)
还没有任何评论哟~


