
Python爬虫实践(Requests+BeautifulSoup版)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本书专注于使用Python进行网络数据抓取的技术细节与实战应用,通过结合Requests和BeautifulSoup库讲解如何高效地获取并解析网页信息。适合初学者快速掌握爬虫开发技能。
本课程是一个Python爬虫实战课程,主要使用Requests+BeautifulSoup实现爬虫功能。课程分为五个部分:
第一部分:CSS选择器,涵盖类选择器、ID选择器、标签选择器以及伪类和伪元素的讲解,并介绍组合选择器等。
第二部分:Python正则表达式,解释了Python对正则表达式的支持,包括匹配单字符、多字符的方法,如何处理开头结尾匹配及分组。同时介绍了search、findall、sub 和 split 等方法以及贪婪和非贪婪匹配的概念。
第三部分:Requests框架的使用介绍,涵盖了发送请求的方式、获取响应结果的过程,并讲解了Cookie、Session 的管理以及超时设置与代理处理的方法。
第四部分:BeautifulSoup框架的应用,着重于遍历文档结构、搜索节点内容及修改文档等技能的学习和实践。
第五部分:项目实战,在这个阶段学员将通过爬取博客园的博客文章来综合运用前面几课所学的知识。
全部评论 (0)
还没有任何评论哟~


