
通过使用BeautifulSoup爬虫程序,可以获取百度搜索结果的标题和URL。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
如果开发者已经掌握了Java语言中的jsoup包,那么学习Python的BeautifulSoup库应当会变得相当简单。以下是示例代码:
```python
#coding: utf-8
import sys
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
question_word = 吃货 程序员
url = http://www.baidu.com/s?wd= + urllib.quote(question_word.decode(sys.stdin.encoding).encode(gbk))
htmlpage = urllib2.urlopen(url)
```
全部评论 (0)
还没有任何评论哟~


