本教程详细介绍如何利用Python编程语言从豆瓣网站获取图书信息的数据抓取技术与实践操作。
爬取指定标签列表下评分8.5分以上的图书信息,包括书名、作者、评分和简介,并将这些数据保存到Excel文件的不同工作表中。
核心代码如下:
```python
title = book.find_element_by_xpath(.//a[1]).text # 获取书名
zuozhe = book.find_element_by_xpath(.//div[1]).text.split(,)[0] # 获取作者
jianjie = book.find_element_by_xpath(.//p[1]).text # 获取简介
# 将数据写入Excel文件的相应单元格中
worksheet.write(i, 0, fenshu) # 分数写入第i行的第一列
worksheet.write(i, 1, title) # 书名写入第i行的第二列
worksheet.write(i, 2, zuozhe) # 作者写入第i行的第三列
worksheet.write(i, 3, jianjie) # 简介写入第i行的第四列
```