本项目运用Python语言进行携程网航班信息的数据爬取,旨在提升个人Web爬虫技术实践能力。欢迎指正与交流。
航班信息接口的地址是 `https://flights.ctrip.com/itineraryapi/12808/products`。此接口包含了查询到的所有航班详情,在 `routeList` 中可以找到相关数据。
为了获取城市的英文缩写,需要在提交 POST 请求时将这些城市的信息加入 DataFrame 中。可以通过访问另一个 API 地址来获得所需的字母缩写信息:`https://flights.ctrip.com/itineraryapi/poi/get`。这个接口包含了各个城市的缩写代码,通过请求该地址即可获取到所需的城市英文简称。
可以利用正则表达式进一步处理这些数据以提取有用的信息。