为了通过爬虫快速获取网站中的信息,我们通常将第一次爬取的网页中的url形成一个待爬取的列表 为了访问网站以及对网站源代码进行分析,这里使用urllib的request库获取网页源代码,使用lxml库对网页进行结构分析。 首先引用需要的库 import urllib.request import lx ...
分类:
编程语言 时间:
2021-02-26 13:00:47
阅读次数:
0
from selenium import webdriver import time import json wb = webdriver.Chrome() wb.get('https://www.baidu.com') wb.maximize_window() time.sleep(3) # 登录 ...
分类:
编程语言 时间:
2021-02-26 12:56:21
阅读次数:
0
Mock概念 mock 的意思是模拟,也就是模拟接口返回的信息,用已有的信息替换它需要返回的信息,从实现对所依赖的模块的测试。 一般有两种场景: 前端对后端接口的 mock, 后端服务之间的测试中涉及的mock,常常发生在单元测试的时候。 前端mock可以通过一些工具来完成: 使用抓包工具Fiddl ...
分类:
编程语言 时间:
2021-02-26 12:52:30
阅读次数:
0
1、 >>> a = "gooD" ##测试字符串 >>> a.lower() ##全部变为小写 'good' >>> a.upper() ## 全部变为大写 'GOOD' >>> a.casefold() ## 全部变为小写 'good' >>> a.capitalize() ## 首字母大写 ' ...
分类:
编程语言 时间:
2021-02-25 12:19:06
阅读次数:
0
目录 | 上一节 (2.4 序列) | 下一节 (2.6 列表推导式) 2.5 collections 模块 collections 模块为数据处理提供了许多有用的对象。本部分简要介绍其中的一些特性。 示例:事物计数 假设要把每只股票的总份额表格化。 portfolio = [ ('GOOG', 1 ...
分类:
编程语言 时间:
2021-02-25 12:14:57
阅读次数:
0
简易版HyperLogLog Python代码: import math import random import uuid import hashlib from bisect import bisect_right HLL_ALPHA_INF = 0.721347520444481703680 ...
分类:
其他好文 时间:
2021-02-25 12:14:18
阅读次数:
0
异常模块 下面介绍python常用的异常模块 AttributeError异常 AttributeError试图访问一个类中不存在的成员(包括:成员变量、属性和成员方法)而引发的异常 AttributeError:'Animal' object has no attribute 'age' OSEr ...
分类:
编程语言 时间:
2021-02-25 12:11:17
阅读次数:
0
目录: Python格式化字符串的4中方式 一:%号 二:str.format 三:f-Strings 四:标准库模板 五:总结四种方式的应用场景 Python格式化字符串的4种方式 一:%号 ? %号格式化字符串的方式从Python诞生之初就已经存在,时至今日,python官方也并未弃用%号,但也 ...
分类:
编程语言 时间:
2021-02-25 12:09:41
阅读次数:
0
引用原链接:https://www.cnblogs.com/tp1226/p/8453854.html 我们经常在python的模块目录中会看到 "__init__.py" 这个文件,那么它到底有什么作用呢? 1. 标识该目录是一个python的模块包(module package) 如果你是使用p ...
分类:
编程语言 时间:
2021-02-25 11:58:33
阅读次数:
0
https://download.csdn.net/download/qq_31293575/15450093 ??? ...
分类:
编程语言 时间:
2021-02-25 11:49:41
阅读次数:
0