
Python爬虫笔记整理(三):基本概念与常用方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本篇笔记详细介绍了Python爬虫的基本概念和常用技术方法,旨在帮助初学者快速掌握爬虫的基础知识。
笔记整理——Python爬虫(三):基本概念及常用基本方法
一、爬虫基本概念
定义了使用爬虫的目的以及企业获取数据的方式,并介绍了用Python进行爬虫开发的优势,同时对不同类型的爬虫进行了分类。
二、爬虫请求模块
介绍如何导入和使用urllib.request模块中的urlopen()与Request()等常用方法。
三、URL地址编码
讲解了通过引入urllib.parse来实现urlencode(dict)以及quote(str)和unquote(str)的编码解码功能,并提供了百度贴吧数据抓取案例作为示例9,以帮助理解这些概念的实际应用。
四、正则解析模块re
描述了如何使用Python内置的re模块进行文本匹配与提取。包括介绍了元字符的概念及思考题:请写出匹配任意一个字符的正则表达式;还讨论了贪婪匹配(默认)和非贪婪匹配的区别,并提供了示例来加深理解。
全部评论 (0)
还没有任何评论哟~


