
Python爬虫技术与信息抽取(实例分析)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
《Python爬虫技术与信息抽取》一书通过大量实例深入浅出地讲解了如何利用Python进行网络数据采集和文本信息提取的技术及应用。
课程体系结构:
1. Requests框架:自动爬取HTML页面与提交网络请求。
2. robots.txt: 网络爬虫排除标准。
3. BeautifulSoup框架:解析HTML页面内容。
4. Re框架(正则表达式):用于提取网页中的关键信息。
5. Scrapy框架:介绍网络爬虫的基本原理及专业的爬虫开发理念。
理念:
“网站即API”……
Python语言常用的IDE工具:
文本编辑器类IDE包括IDLE、Notepad++、Sublime Text、Vim & Emacs、Atom和Komodo Edit等;集成开发环境(IDE)则有PyCharm、Wing IDE以及基于Eclipse的插件如PyDev,还有Visual Studio。
全部评论 (0)
还没有任何评论哟~


