浏览器的基本操作与元素定位 通过上一章学习,我们已经学会了如何设置驱动路径,如何创建浏览器对象,如何打开一个网站,接下来我们要进行一些复杂的操作比如先打开百度首页,在打开博客园,网页后退,前进等等,甚至可以获取一些浏览器信息等等。 首先看一个基本的例子,流程如下: 对应的代码如下: 再来看一个例子, ...
分类:
其他好文 时间:
2018-07-10 11:25:33
阅读次数:
289
默认请求头 命令行执行,新建爬虫 我们通过对 https://httpbin.org/get?show_env=1 的请求,查看本次请求的浏览器信息,可以打开看一看是否是自己的浏览器信息 将返回的文本复制到 https://www.json.cn/ 格式化成便于查看的json格式,下面操作亦然,不再 ...
分类:
Web程序 时间:
2018-06-23 15:41:44
阅读次数:
617
登录流程: 输入127.0.0.1/login 把浏览器信息,客户端地址,访问地址等封装到request里,以GET方式发送给login的url(因为是访问页面,所以是GET请求) 匹配到对应的url 在根据url匹配到处理函数,直接显示页面,完成访问登录页面 在登录页面输入用户名密码,点击登录 f ...
分类:
其他好文 时间:
2018-06-06 21:49:30
阅读次数:
206
方法一: HTML+ 封装好的方法,额外配置,使用指定方法打包才可用 属性: imei: 设备的国际移动设备身份码 imsi: 设备的国际移动用户识别码 model: 设备的型号 vendor: 设备的生产厂商 uuid: 设备的唯一标识 参考地址: http://www.html5plus.org ...
分类:
移动开发 时间:
2018-05-23 11:50:22
阅读次数:
1615
HTTP请求包(浏览器信息) 我们先来看看Request包的结构, Request包分为3部分,第一部分叫Request line(请求行), 第二部分叫Request header(请求头),第三部分是body(主体)。header和body之间有个空行,请求包的例子所示: GET /domain ...
分类:
Web程序 时间:
2018-05-04 14:09:55
阅读次数:
177
1.主题: 简单爬取简书中的专题‘’@IT·互联网“中的文章,爬取信息之后通过jieba分词生成词云并且进行分析; 2.实现过程: 第一步:打开简书并进入到@IT-互联网专题 网页链接:https://www.jianshu.com/c/V2CqjW?utm_medium=index-collect ...
分类:
编程语言 时间:
2018-04-29 22:13:59
阅读次数:
332
scrapy 伪装代理和fake_userAgent的使用 伪装浏览器代理 在爬取网页是有些服务器对请求过滤的不是很高可以不用ip来伪装请求直接将自己的浏览器信息给伪装也是可以的。 第一中方法: 1.在setting.py文件中加入以下内容,这是一些浏览器的头信息 USER_AGENT_LIST = ...
分类:
编程语言 时间:
2018-04-23 15:42:39
阅读次数:
243
核心知识点: 1.BOM(浏览器窗口对象模型) DOM(文本对象模型) 2.window对象是客户端JavaScript最高层对象之一,属于全局对象,一般书写可以省略 3.window对象常用的方法 (1)窗口对象方法 (2)子对象方法 a.navigator对象(一般用于读取浏览器信息) b.sc ...
分类:
其他好文 时间:
2017-12-30 12:38:01
阅读次数:
184
之前懒得写判断ie版本js,因为网上关于这方面的代码太多了,所以从网上拷贝了一个,放到项目上才发现由于时效性的问题,代码不生效。就自己写一个吧。 你一定发现了,ie11和edge的userAgent是和ie8,9,10差别蛮大的,那么对用的在写js时需要特别判断,下面给出我写好的一段判断是否是ie且 ...
分类:
Web程序 时间:
2017-12-27 19:39:13
阅读次数:
221
当用户发送一个http请求的时候,浏览的的版本信息也包含在了http请求信息中: 如上图所示,请求 google plus 请求头就包含了用户的浏览器信息: User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTM ...
分类:
Web程序 时间:
2017-12-16 17:15:08
阅读次数:
237