浏览器的基本操作与元素定位 通过上一章学习,我们已经学会了如何设置驱动路径,如何创建浏览器对象,如何打开一个网站,接下来我们要进行一些复杂的操作比如先打开百度首页,在打开博客园,网页后退,前进等等,甚至可以获取一些浏览器信息等等。 首先看一个基本的例子,流程如下: 对应的代码如下: 再来看一个例子, ...
分类:
其他好文 时间:
2018-07-10 11:25:33
阅读次数:
289
一般输入框有以下几种形式 第一种:短的input框 如百度首页的输入框,<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" autocomplete="off">,百度输入框的值不在text中,是在value属性中 又 ...
分类:
其他好文 时间:
2018-07-04 01:07:53
阅读次数:
255
from selenium import webdriverimport timeb=webdriver.Ie()b.implicitly_wait(10)b.get('www.baidu.com')e2=b.find_element_by_id('u1')list1=e2.find_element ...
分类:
其他好文 时间:
2018-06-29 12:12:51
阅读次数:
188
一. 如何处理首次登陆的引导页面 refresh():页面刷新。可以再浏览器中刷新一下,就可以取消引导页 二. 操作页面弹出框中的元素 1. 强制等待 sleep(秒) 比如百度首页的登录弹出框,在访问百度的时候,它就在html页面中出现了,只不过默认display:none,没有展示而已(这种弹出 ...
分类:
其他好文 时间:
2018-06-27 18:07:53
阅读次数:
213
1. Python3 使用urllib库请求网络 1.1 基于urllib库的GET请求 请求百度首页www.baidu.com ,不添加请求头信息: 输出显示百度首页的源码。但是有的网站进行了反爬虫设置,上述代码可能会返回一个40X之类的响应码,因为该网站识别出了是爬虫在访问网站,这时需要伪装一下 ...
分类:
编程语言 时间:
2018-06-26 22:36:04
阅读次数:
316
web driver提供了八种元素定位的方法: id, name, class name, tag name, link text, partial link text, xpath, css selector 如百度首页,百度一下按钮的元素信息 <input type="submit" id="s ...
分类:
其他好文 时间:
2018-06-18 11:56:41
阅读次数:
301
浏览器访问网页原理(理解) 所以综合我们的第二点和第三点,我们得出一个结论,这些系统自动创建的文件夹和当前被打开的网页又一定的关系 通过观察发现这些文件夹中存储的内容和网页上的内容有对应关系 那么这些文件夹是什么文件夹呢? 其实这些文件夹我们称之为缓存文件夹,缓存文件夹是专门用于存储网页数据的文件夹 ...
分类:
Web程序 时间:
2018-06-11 13:58:38
阅读次数:
173
一、URL和URI URI:统一资源标识符 URL:统一资源定位符 百度首页的图标连接 https://www.baidu.com/img/bd_logo1.png 它是一个URL,也是一个URI,包括了访问协议、访问路径和资源名 URL是URI的子集,每个URL都是URI,但不是每个URI都是UR ...
分类:
Web程序 时间:
2018-06-01 00:15:58
阅读次数:
239