
公司信息通过天眼查爬虫和企查查爬虫进行指定关键字的抓取。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
天眼查和企查查的公司信息爬虫的设置,包括数据源配置,采用如下方式:MysqlConfig 被定义为 `{ develop: { host: 192.168.1.103, port: 3306, db: enterprise, username: root, password: root@123 } }`。随后,执行位于db/data.sql的文件,以生成数据结构的配置信息。此外,全局代理控制被设置为启用状态,即 GLOBAL_PROXY 被设为 True。代理池的 URL 设置为 http://localhost:5010。最后,用于爬取数据的关键字列表被设定为 [Google],并通过 crawler.load_keys(keys) 方法加载。
全部评论 (0)
还没有任何评论哟~


