python利用selenium+requests+beautifulsoup爬取12306火车票信息

时间：2019-01-12 10:39:06 阅读：240 评论：0 收藏：0 [点我收藏+]

在高速发展的时代。乘车出远门是必不可少的，有些查询信息是要收费的。这里打造免费获取火车票信息

想要爬取12306火车票信息，访问12306官方网站，输入出发地，目的地，时间之后点击确定，这是我们打开谷歌浏览器开发者模式找到 https://kyfw.12306.cn/otn/resources/js/framework/station_name.js 这里包含了所有城市的信息和所有城市的缩写字母。想要获取火车票信息 https://kyfw.12306.cn/otn/leftTicket/queryZ?leftTicketDTO.train_date=2019-01-19&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=SHH&purpose_codes=ADULT ，这是北京到上海浏览器确定之后所抓的包从中可以看出 BJP =北京而 SHH=上海 . 下图为所有城市代号技术分享图片

现在把上面的js 数据转变为json数据 {“北京”：BJP ,"上海":SSH}

根据字符窜的 split ()方法按照“=”进行拆分取出等号后面的数据 “字符窜”.split("=")[1] 这样就获取到等号后面的数据如下图：

技术分享图片

获得数据之后然后在根据 "|" 进行拆分并去除 “@”得到如下

技术分享图片

根据相邻俩个组成json数据,遍历数组分为俩个数组一个为实体一个为简写然后再根据python强大的函数 dict(zip(数组1,数组2)) 将其变为 json键值对之后将数据

https://kyfw.12306.cn/otn/leftTicket/queryZ?leftTicketDTO.train_date=2019-01-19&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=SHH&purpose_codes=ADULT 抓包获得是网址之后利用selenium 进行定位 beautifulsoup解析数据获取要的值然后进行保存

以下是完整代码截图仅供参考

技术分享图片

python利用selenium+requests+beautifulsoup爬取12306火车票信息

标签：遍历 ati sources requests 官方网站实体北京组成时代

原文地址：https://www.cnblogs.com/MaomaoWorld/p/10258404.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行