标签:python via original 上班 xmx http src 手动 primary
同事说最近火车票难买,我就帮他用个脚本监控 一下。
最近高铁票比较难买,还有什么候补。要不停的刷,才有时候可以捡漏。有时候明明候补了,到快开车告诉你余票不足,候补失败。
凡事预则立,我打算写个脚本提前两个星期就监控起来,这样就可以提高买到票的几率了。
先是考虑用接口,发现行不通,手动打开页面都OK,就是接口调不到数据。只好曲线救国,用selenium打开页面,用BeautifulSoup来获取页面内容。发现打开页面后,可以直接用数据清洗。大概的代码是这样的:
把自己需要乘坐的车次,日期给设定好,当然我这边主要是要算周五跟周一,监控了两个星期的这两天。设置好定时,给自己发邮件。
然后发邮件,大概样子是这样的:
这样上班的时候,就收到邮件,就可以择机买票了。
现在来聊聊,处理web页面,可能用到哪些库。
python对web的操作常用到的库:请求库,解析库,存储库,工具库
urllib/re是python默认自带的库
例子:
Request 可以添加headers
例子:
代理
?
Cookie’
第一种保存cookie方式
pip3 install beautifulsoup4
标签:python via original 上班 xmx http src 手动 primary
原文地址:https://www.cnblogs.com/7758520lzy/p/12010446.html