码迷,mamicode.com
首页 > 其他好文 > 详细

(八)自动化测试之selenium学习心得-Xpath选择器

时间:2021-04-05 11:51:33      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:代码   selector   爬虫框架   python   一个   fir   win   格式   技术   

一、Xpath语法简介

还有一种 灵活、强大 的选择元素的方式,就是使用 Xpath 表达式。

XPath (XML Path Language) 是由国际标准化组织W3C指定的,用来在 XML 和 HTML 文档中选择节点的语言。

目前主流浏览器 (chrome、firefox,edge,safari) 都支持XPath语法,xpath有 1 和 2 两个版本,目前浏览器支持的是 xpath 1的语法。


既然已经有了CSS,为什么还要学习 Xpath呢? 因为

有些场景 用 css 选择web 元素 很麻烦,而xpath 却比较方便。

另外 Xpath 还有其他领域会使用到,比如 爬虫框架 Scrapy, 手机App框架 Appium。

 

xpath 语法中,整个HTML文档根节点用‘/‘表示,如果我们想选择的是根节点下面的html节点,则可以在搜索框输入

/html

如果输入下面的表达式

/html/body/div
这个表达式表示选择html下面的body下面的div元素。

 

1.1、绝对路径选择
从根节点开始的,到某个节点,每层都依次写下来,每层之间用 / 分隔的表达式,就是某元素的 绝对路径

上面的xpath表达式 /html/body/div ,就是一个绝对路径的xpath表达式, 等价于 css表达式 html>body>div


自动化程序要使用Xpath来选择web元素,应该调用 WebDriver对象的方法 find_element_by_xpath 或者 find_elements_by_xpath,像这样:

elements = driver.find_elements_by_xpath("/html/body/div")

 

代码例子如下:

from selenium import webdriver

wd = webdriver.Chrome()
wd.implicitly_wait(10)
wd.get(‘http://cdn1.python3.vip/files/selenium/test1.html‘)

# Xpath绝对路径选择
elements = wd.find_elements_by_xpath(‘/html/body/div‘)

for element in elements:
print(element.get_attribute(‘outerHTML‘))


wd.quit()

技术图片

 

 

1.2、相对路径选择
有的时候,我们需要选择网页中某个元素, 不管它在什么位置 。

比如,选择示例页面的所有标签名为 div 的元素,如果使用css表达式,直接写一个 div 就行了。

那xpath怎么实现同样的功能呢? xpath需要前面加 // , 表示从当前节点往下寻找所有的后代元素,不管它在什么位置。

所以xpath表达式,应该这样写: //div


‘//’ 符号也可以继续加在后面,比如,要选择 所有的 div 元素里面的 所有的 p 元素 ,不管div 在什么位置,也不管p元素在div下面的什么位置,则可以这样写 //div//p

对应的自动化程序如下

elements = driver.find_elements_by_xpath("//div//p")

如果使用CSS选择器,对应代码如下

elements = driver.find_elements_by_css_selector("div p")

如果,要选择 所有的 div 元素里面的 直接子节点 p , xpath,就应该这样写了 //div/p

如果使用CSS选择器,则为 div > p

代码例子如下:

from selenium import webdriver

wd = webdriver.Chrome()
wd.implicitly_wait(10)
wd.get(‘http://cdn1.python3.vip/files/selenium/test1.html‘)

# Xpath相对路径选择
elements = wd.find_elements_by_xpath(‘//div//p‘)

for element in elements:
print(element.get_attribute(‘outerHTML‘))


wd.quit()

技术图片

 

 

1.3、通配符
如果要选择所有div节点的所有直接子节点,可以使用表达式 //div/*

* 是一个通配符,对应任意节点名的元素,等价于CSS选择器 div > *

代码例子:

from selenium import webdriver

wd = webdriver.Chrome()
wd.implicitly_wait(10)
wd.get(‘http://cdn1.python3.vip/files/selenium/test1.html‘)

# Xpathx的通配符
elements = wd.find_elements_by_xpath(‘//select/*‘)

for element in elements:
print(element.get_attribute(‘outerHTML‘))

wd.quit()

技术图片

 

 

二、根据属性选择

Xpath 可以根据属性来选择元素。

根据属性来选择元素 是通过 这种格式来的 [@属性名=‘属性值‘]

注意:

属性名注意前面有个@

属性值一定要用引号, 可以是单引号,也可以是双引号

2.1、根据id属性选择
选择 id 为 west 的元素,可以这样 //*[@id=‘west‘]

2.2、根据class属性选择
选择所有 select 元素中 class为 single_choice 的元素,可以这样 //select[@class=‘single_choice‘]

如果一个元素class 有多个,比如

<p id="beijing" class=‘capital huge-city‘>
北京
</p>
如果要选 它, 对应的 xpath 就应该是 //p[@class="capital huge-city"]

不能只写一个属性,像这样 //p[@class="capital"] 则不行

2.3、根据其他属性
同样的道理,我们也可以利用其它的属性选择

比如选择 具有multiple属性的所有页面元素 ,可以这样 //*[@multiple]

属性值包含字符串
要选择 style属性值 包含 color 字符串的 页面元素 ,可以这样 //*[contains(@style,‘color‘)]

要选择 style属性值 以 color 字符串 开头 的 页面元素 ,可以这样 //*[starts-with(@style,‘color‘)]

要选择 style属性值 以 某个 字符串 结尾 的 页面元素 ,大家可以推测是 //*[ends-with(@style,‘color‘)], 但是,很遗憾,这是xpath 2.0 的语法 ,目前浏览器都不支持

 

代码例子如下:

from selenium import webdriver

wd = webdriver.Chrome()
wd.implicitly_wait(10)
wd.get(‘http://cdn1.python3.vip/files/selenium/test1.html‘)

# Xpath根据属性选择
elements = wd.find_elements_by_xpath(‘//p[@class = "capital huge-city"]‘)

for element in elements:
print(element.get_attribute(‘outerHTML‘))

wd.quit()

技术图片

 

三、按次序选择

前面学过css表达式可以根据元素在父节点中的次序选择, 非常实用。

xpath也可以根据次序选择元素。 语法比css更简洁,直接在方括号中使用数字表示次序

比如

3.1、某类型 第几个 子元素

比如

要选择 p类型第2个的子元素,就是

//p[2]
注意,选择的是 p类型第2个的子元素 , 不是 第2个子元素,并且是p类型 。

注意体会区别


再比如,要选取父元素为div 中的 p类型 第2个 子元素

//div/p[2]


3.2、第几个子元素
也可以选择第2个子元素,不管是什么类型,采用通配符

比如 选择父元素为div的第2个子元素,不管是什么类型

//div/*[2]


3.3、某类型 倒数第几个 子元素
当然也可以选取倒数第几个子元素

比如:

选取p类型倒数第1个子元素
//p[last()]
选取p类型倒数第2个子元素
//p[last()-1]
选择父元素为div中p类型倒数第3个子元素
//div/p[last()-2]

 

3.4、范围选择

xpath还可以选择子元素的次序范围。

比如,

选取option类型第1到2个子元素
//option[position()<=2]
或者

//option[position()<3]


选择class属性为multi_choice的前3个子元素
//*[@class=‘multi_choice‘]/*[position()<=3]
选择class属性为multi_choice的后3个子元素
//*[@class=‘multi_choice‘]/*[position()>=last()-2]
为什么不是 last()-3 呢? 因为

last() 本身代表最后一个元素

last()-1 本身代表倒数第2个元素

last()-2 本身代表倒数第3个元素

代码例子如下:

from selenium import webdriver

wd = webdriver.Chrome()
wd.implicitly_wait(10)
wd.get(‘http://cdn1.python3.vip/files/selenium/test1.html‘)

# Xpath根据属性选择
elements = wd.find_elements_by_xpath(‘//*[@class="multi_choice"]/option[position()>=last()-2]‘)

for element in elements:
print(element.get_attribute(‘outerHTML‘))

wd.quit()

技术图片

 

 

 

四、组选择、父节点、兄弟节点

 4.1、组选择

css有组选择,可以同时使用多个表达式,多个表达式选择的结果都是要选择的元素

css 组选择,表达式之间用 逗号 隔开

xpath也有组选择, 是用 竖线 隔开多个表达式

比如,要选所有的option元素 和所有的 h4 元素,可以使用

//option | //h4
等同于CSS选择器

option , h4

再比如,要选所有的 class 为 single_choice 和 class 为 multi_choice 的元素,可以使用

//*[@class=‘single_choice‘] | //*[@class=‘multi_choice‘]
等同于CSS选择器

.single_choice , .multi_choice

 

4.2、选择父节点
xpath可以选择父节点, 这是css做不到的。

某个元素的父节点用 /.. 表示

比如,要选择 id 为 china 的节点的父节点,可以这样写 //*[@id=‘china‘]/.. 。

当某个元素没有特征可以直接选择,但是它有子节点有特征, 就可以采用这种方法,先选择子节点,再指定父节点。


还可以继续找上层父节点,比如 //*[@id=‘china‘]/../../..

技术图片

 

 

4.3、兄弟节点选择
前面学过 css选择器,要选择某个节点的后续兄弟节点,用 波浪线

xpath也可以选择 后续 兄弟节点,用这样的语法 following-sibling::

比如,要选择 class 为 single_choice 的元素的所有后续兄弟节点 //*[@class=‘single_choice‘]/following-sibling::*

等同于CSS选择器 .single_choice ~ *

如果,要选择后续节点中的div节点, 就应该这样写 //*[@class=‘single_choice‘]/following-sibling::div


xpath还可以选择 前面的 兄弟节点,用这样的语法 preceding-sibling::

比如,要选择 class 为 single_choice 的元素的所有前面的兄弟节点 //*[@class=‘single_choice‘]/preceding-sibling::*

而CSS选择器目前还没有方法选择前面的 兄弟节点

 

注意:xpath 会遇到一个这样的问题,CSS选择器不会

如下代码:

from selenium import webdriver

wd = webdriver.Chrome()
wd.implicitly_wait(10)
wd.get(‘http://cdn1.python3.vip/files/selenium/test1.html‘)

# 根据id定位到china元素
china = wd.find_element_by_id(‘china‘)

# 再选择该元素内部的p元素
elements = china.find_elements_by_xpath(‘//p‘)

for element in elements:
print(element.get_attribute(‘outerHTML‘))

wd.quit()

技术图片

 

 

运行发现,打印的 不仅仅是 china内部的p元素, 而是所有的p元素。

要在某个元素内部使用xpath选择元素, 需要 在xpath表达式最前面加个点 。

技术图片

 

 

(八)自动化测试之selenium学习心得-Xpath选择器

标签:代码   selector   爬虫框架   python   一个   fir   win   格式   技术   

原文地址:https://www.cnblogs.com/tangchunlitester/p/14610335.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!