标签:driver txt 一个 网站 列表 res 表示 键盘 打开文件
这一章讲了如何在 Web 上抓取相关的信息,工具是三个模块:
导入:import webbrowser
格式:webbrowser.open(‘http://url.com‘)
功能:它的 open() 函数可用于打开一个网站。
导入:import requests
格式:request.get(‘http://www.url.com/pg1112.txt‘)
功能:它的 get() 函数可用于下载一个网页或者文件,返回一个 Response 对象。
格式:response.open(‘example.txt‘,‘wb‘)
功能:接受第一个参数为文件的字符串,第二个参数为‘wb‘,表示用二进制打开,目的是为了保护文件的 Unicode 编码。
格式:
response.iterate_content(10000):可利用其参与循环
open.write():将内容写入文件
导入:import bs4
功能:解析 HTML
导入:from selenium import webdriver
格式:browser = webdriver.Safari()
功能:打开一个浏览器,返回一个 WebDriver 数据类型的对象。
格式:browser.find_element_by_id(id) 等等
功能:查找 Web 上特定的元素,返回一个 WebElement 对象。
输入特殊键需要用到 from selenium.webdriver.common.keys import Keys
格式:send_keys(Keys.DOWN)
browser.back():返回
browser.forward():前进
browser.refresh():刷新页面
browser.quit():关闭页面
Python 编程快速上手 第十一章 Web scrapping
标签:driver txt 一个 网站 列表 res 表示 键盘 打开文件
原文地址:https://www.cnblogs.com/FBsharl/p/10313659.html