码迷,mamicode.com
首页 > 编程语言 > 详细

python+selenium获取禅道所有Bug标题

时间:2018-07-01 10:26:03      阅读:336      评论:0      收藏:0      [点我收藏+]

标签:element   sub   自己   \n   ota   return   优惠券   open   TE   

前言:

对于一组很多的数据,一个页面加载不完,需要分页加载,比如禅道的Bug数,一页默认是20个(自己可以根据需求更改),这时就有了第二页,第三页等等。

这时如果要获取所有的Bug标题来怎么做呢?

点击下一页Bug,你会发现url的变化,就只有最后一个数字改变,如下图:

技术分享图片

技术分享图片

大体思路:

获取所有url→ddt驱动获取每一页的数据

步骤:

第一步:获取所有url

这里已经显示了总共有几页和当前所在的页面数,我们要获取的就后面的数字 ‘3’。

先定位到这个元素,在通过正则取出后面的 ‘3’,具体代码如下:

技术分享图片

b=self.driver.find_element_by_xpath(".//*[@id=‘bugList‘]/tfoot/tr/td/div[2]/div/strong[2]")
page=re.findall(r/(.+?),b.text)
total_page=page[0]
print(总共的页数:,total_page)

接下来就是要用到range函数了,获取所有的url地址了,代码如下:

for i in range(1,int(total_page)+1):
  Url=url+/zentao/bug-browse-1--unclosed-0--60-20-%s.html % i
  print(Url)

最后控制台输出如下:

技术分享图片

观察下,是不是只有后面的1,2,3在跟着变,其他无任何变化,这时就可以将这些url添加到一个list中去,用做接下来的ddt驱动的数据了

具体代码如下:

#coding:utf-8
from selenium.webdriver.firefox.webdriver import WebDriver as Firefox
import re,time
from selenium.webdriver.support.ui import WebDriverWait
class GetUrl():
    ‘‘‘获取所有URL页面‘‘‘
    def get_url(self,url,username,psw):
        self.driver=Firefox()
        self.driver.maximize_window()
        self.driver.set_page_load_timeout(20)
        self.driver.implicitly_wait(20)
        self.driver.get(url+/zentao/user-login-L3plbnRhby8=.html) #输入网址
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id("account")).send_keys(username) #输入账号
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_name("password")).send_keys(psw)   #输入密码
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id(submit)).click()              #点击登录按钮
        time.sleep(2)
        self.driver.find_element_by_xpath(".//*[@id=‘mainmenu‘]/ul/li[4]/a").click()
        time.sleep(2)
        self.driver.find_element_by_xpath(".//*[@id=‘modulemenu‘]/ul/li[2]/a").click()
        time.sleep(2)
        table=self.driver.find_element_by_id(bugList)  #获取到bugList这个表格
        table_rows=table.find_elements_by_tag_name(tr) #获取行数
        print((每一页数据的条数:),(len(table_rows)-2))    #这里减2是减去表格最上面和最下面那行
        b=self.driver.find_element_by_xpath(".//*[@id=‘bugList‘]/tfoot/tr/td/div[2]/div/strong[2]") #定位到页面显示总页数那个元素(1/3)
        page=re.findall(r/(.+?),b.text)  #通过正则取出后面那个总页数(也就是那个3)
        total_page=page[0]
        print(总共的页数:,total_page)
        a=[]  #创建空list去接收生成的url
        for i in range(1,int(total_page)+1):
            Url=url+/zentao/bug-browse-1--unclosed-0--60-20-%s.html % i
            a.append(Url)  
        print(a)
        self.driver.close()
        return a
if __name__==__main__:
    url=http://127.0.0.1
    username=admin
    psw=123456
    a=GetUrl()
    a.get_url(url,username,psw)

 

 

第二步:编写另一个类来执行

1.导入第一步的url结果

 2.添加ddt驱动

3.将结果写入TXT中

具体代码如下:

#coding:utf-8
import unittest
import ddt
import time
from com.Practice.test_geturl import GetUrl
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
url=http://127.0.0.1
username=admin
psw=123456
test_url=GetUrl().get_url(url,username,psw)
@ddt.ddt
class Test(unittest.TestCase):
    ‘‘‘获取所有Bug标题‘‘‘
    @ddt.data(*test_url)
    def test_01(self,test_url):
        self.driver = webdriver.Firefox()
        self.driver.get(http://127.0.0.1/zentao/user-login-L3plbnRhby8=.html)
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id("account")).send_keys(admin)
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_name("password")).send_keys(123456)
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id(submit)).click()
        time.sleep(1)
        self.driver.get(test_url)
        a=self.driver.find_elements_by_xpath(".//*[@id=‘bugList‘]/tbody/tr/td[4]/a")
        for i in a:
            print(i.text)
            try:
                with open(zendao.txt,a) as f:
                    f.write(i.text+\n)  
            except Exception as msg:
                print(写入时出错啦:%s % msg)     
        time.sleep(1)
    def tearDown(self):
        self.driver.close()

if __name__==__main__:
    unittest.main()

这里获取文本信息是通过table定位获取。

最后TXT打印结果(没截全):

技术分享图片

 

技术分享图片

技术分享图片

这个是一个优惠券生成的网址,也是分页显示,原理和上面大体相同。

结语:

 这个有点麻烦,应该还有更简单的方法。只可惜小白一枚,能力不足,暂时就只能先这样做了,欢迎大家提意见!!!

 

python+selenium获取禅道所有Bug标题

标签:element   sub   自己   \n   ota   return   优惠券   open   TE   

原文地址:https://www.cnblogs.com/luobobobo/p/9249193.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!