标签:tps download www. 开始 str 网页 txt 周杰伦 入门
pip install Selenium
chrome驱动文件:点击下载chromedriver (yueyu下载)
我的电脑–>属性–>系统设置–>高级–>环境变量–>系统变量–>Path,将“F:\GeckoDriver”目录添加到Path的值中。比如:Path字段;F:\GeckoDriver
driver=webdriver.Chrome() #实例化一个浏览器 driver.get(‘https://www.baidu.com‘) #浏览器访问百度 input_tag=driver.find_element_by_id(‘kw‘) #获取输入框 input_tag.send_keys(‘赵丽颖‘)#输入框中输入‘赵丽颖 driver.find_element_by_id(‘su‘).click() #找到’百度一下‘按钮,并点击,开始搜索 driver.find_element_by_link_text(‘知道‘).click() #点击页面上的 ’知道‘
#设置浏览器显示窗口大小 driver.set_window_size(480,800) driver.get(‘https://www.zhihu.com‘) #访问知乎 driver.back() #回退到上一个访问页面 driver.forward() #前进到下一个访问过的页面
drive.quit() #退出浏览器
driver=webdriver.Chrome() #实例化一个浏览器 driver.get(‘https://www.baidu.com‘) #浏览器访问百度 input_tag.send_keys(‘赵丽颖‘)#输入框中输入‘赵丽颖 driver.find_element_by_id(‘kw‘).clear() #清空输入框 driver.find_element_by_id(‘kw‘).send_keys(‘周杰伦‘) #输入查询 ’周杰伦‘ driver.find_element_by_id("su").click() #点击百度一下
# 属性 size和文本 driver.get(‘http://www.baidu.com‘) driver.find_element_by_id(‘kw‘).size #获取搜索的元素的尺寸{‘height‘: 22, ‘width‘: 395} driver.find_element_by_id("cp").text #获取指定标签的文本值 driver.quit()
在 WebDriver 中, 将这些关于鼠标操作的方法封装在 ActionChains 类提供。
执行流程
#引入 ActionChains类 from selenium.webdriver.common.action_chains import ActionChains driver=webdriver.Chrome() driver.get("https://www.baidu.cn") #鼠标定位到需要悬浮的元素 above=driver.find_element_by_link_text(‘设置‘) ditu=driver.find_element_by_link_text(‘地图‘) #对定位的元素执行鼠标操作 ActionChains(driver).move_to_element(above).perform() ActionChains(driver).double_click(above).perform() #鼠标右击 driver.quit() #退出
Keys.SPACE 空格键
Keys.F1 键盘F1键
Keys.CONTROL,‘a‘ 全选 contrl表示contrl键
#引入Keys模块 from selenium.webdriver.common.keys import Keys driver=webdriver.Chrome() driver.get(‘https://www.baidu.com‘) #输入一个内容 input=driver.find_element_by_id(‘kw‘) input.send_keys(‘seleniumGG‘) #删除多余的GG input.send_keys(Keys.BACKSPACE) input.send_keys(Keys.BACKSPACE) #继续输入 input.send_keys(‘教程‘) #全选输入框的内容,一次性删除 input.send_keys(Keys.CONTROL,‘a‘) input.send_keys(Keys.BACKSPACE) #输入周杰伦,通过回车键来代替点击‘百度一下‘ input.send_keys(‘周杰伦‘) input.send_keys(Keys.ENTER) driver.quit()
掌握三个属性
#调用方式 driver.title #返回当前页面的标题 driver.current_url #返回当前页面的url user = driver.find_element_by_class_name(‘nums‘).text #获取某元素的文本信息
#获取图片中的a标签文本信息 from time import sleep driver = webdriver.Chrome() driver.get("https://www.baidu.com") a_list=driver.find_elements_by_xpath(‘//div[@id="u1"]/a‘) for a in a_list: print(a.text) driver.quit()
from selenium import webdriver driver = webdriver.Chrome() driver.get("http://www.renren.com/") #输入账户密码 driver.find_element_by_id(‘email‘).send_keys(‘1837081**31(账号)‘) #换成自己的账号 driver.find_element_by_id(‘password‘).send_keys(‘QWERT***IO(密码)‘) #换成自己的密码 #点击登录 driver.find_element_by_id(‘login‘).click() driver.quit()
driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get("http://www.baidu.com") #获取百度搜索窗口句柄 search_windows=driver.current_window_handle driver.find_element_by_link_text(‘登录‘).click() driver.find_element_by_link_text(‘立即注册‘).click() #获取当前窗口句柄 register_windows=driver.current_window_handle driver.switch_to_window(search_windows) #浏览器跳转记录的窗口
from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains import time driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get(‘http://www.baidu.com‘) # 鼠标悬停至“设置”链接 link = driver.find_element_by_link_text(‘设置‘) ActionChains(driver).move_to_element(link).perform() # 打开搜索设置 driver.find_element_by_link_text("搜索设置").click() # 保存设置 driver.find_element_by_class_name("prefpanelgo").click() time.sleep(2) #获取警告框对象 dialog=driver.switch_to_alert() dialog.text #获取警告框的内容 dialog.accept() #接受结果,确认 driver.quit()
#核心代码 from selenium.webdriver.support.select import Select #搜索结果显示条数设置 sel=driver.find_element_by_xpath(‘//*[@id="nr"]‘) Select(sel).select_by_value(‘10‘)
#第一步导包 from selenium import webdriver from selenium.webdriver.support.select import Select from time import sleep #驱动网页 driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get(‘http://www.baidu.com‘) # 鼠标悬停至“设置”链接 driver.find_element_by_link_text(‘设置‘).click() sleep(1) # 打开搜索设置 driver.find_element_by_link_text("搜索设置").click() sleep(2) #搜索结果显示条数设置 sel=driver.find_element_by_xpath(‘//*[@id="nr"]‘) Select(sel).select_by_value(‘10‘) #保存并关闭 driver.find_element_by_class_name(‘prefpanelgo‘).click() #处理警告框 #1 获取警告框对象 dialog=driver.switch_to_alert() #2 打印文本值 print(dialog.text) #已经记录下您的使用偏好 #3 接受 dialog.accept() driver.quit()
delete_all_cookies(): 删除所有cookie信息。
实际使用 cookie= driver.get_cookies() #获取cookie driver.add_cookie({‘name‘: ‘key-aaaaaaa‘, ‘value‘: ‘value-bbbbbb‘}) #添加cookie
window.scrollTo(0,450); #滑动条往下滑动450
执行方式 js="window.scrollTo(100,450);"
driver.execute_script(js)
js=‘window.scrollTo(0,document.body.scrollHeight)‘ #下滑到底部 driver.execute_script(js)
close() 关闭单个窗口
quit() 关闭所有窗口
标签:tps download www. 开始 str 网页 txt 周杰伦 入门
原文地址:https://www.cnblogs.com/angle6-liu/p/10446191.html