回顾 5种反爬机制 robots.txt:反爬机制,防君子不防小人 UA检测:UA伪装 数据加密 图片懒加载 代理ip requests模块爬取流程: 指定url 发起请求 获取页面数据 数据解析 持久化存储 bs4解析: 环境安装:bs4、lxml解析器 实例化bs对象,将页面源码数据加载到该对象 ...
分类:
编程语言 时间:
2019-09-19 23:28:00
阅读次数:
178
增:append insert append:添加到列表尾; insert:可以插入自己设置的位置。 改:直接用a[1]='内容',多项时,可以用a[1:3]=['内容1',’内容2‘] 删:remove、pop、del a.remove(a[2]),可以这样使用。 del :del a[下标],也 ...
分类:
编程语言 时间:
2019-09-19 22:13:48
阅读次数:
83
集合是无须的,# s={'hello','wold','ada','hello',3,4,5,6,7}# print(s)# s.add('ok')# print(s)# s.add('hello')# print(s)# #s.clear()# print(s)# s1=s.copy()# pri ...
分类:
编程语言 时间:
2019-09-19 22:04:54
阅读次数:
133
#!/usr/bin/env python#-*- coding:utf-8 -*-#name='lhf'# def change_name():# global name# name="帅的一笔"# print('change_name',name)# change_name()# print(n ...
分类:
编程语言 时间:
2019-09-19 21:44:05
阅读次数:
243
一、计算机结构 五大部件:输入设备、输出设备、存储器、运算器、控制器 二、cpu、硬盘、内存三者之间的关系 cpu:是计算机运算核心和控制中心,让电脑的各个部件顺利工作,起到协调和控制作用 硬盘:存储资料和软件等数据设备,有容量大,断电数据不丢失的特点,也被人们称之为“数据仓库” 内存:a、负责硬盘 ...
分类:
编程语言 时间:
2019-09-18 23:24:16
阅读次数:
178
函数前引用:函数即变量,需要在引用前定义好。 ...
分类:
编程语言 时间:
2019-09-15 10:30:37
阅读次数:
68
输出1-100中的偶数 效果图: 实现代码: 解析: for循环的范围(range)可以指定三个参数,即列表创建的三个参数:起始数字、末尾数字、步长(数字间隔),for循环的本质就是创建一个数字列表,i使用列表中的数依次赋值,当列表最后一个数赋值给i循环结束。所以1-100中的偶数即为开始第一个数字 ...
分类:
编程语言 时间:
2019-09-15 00:46:09
阅读次数:
210
import copy l=[1,3.14,[2,4,6]] l2=copy.copy(l) print(l) print(l2) print(id(l)) print(id(l2)) print(' ') for i in l: print(id(i)) print(' ') for i in l ...
分类:
编程语言 时间:
2019-09-14 22:32:39
阅读次数:
92
import win32gui import win32api,win32con import time ''' 需要执行下面命令 pip install pywin32 ''' # 获取屏幕宽高 screen_width=win32api.GetSystemMetrics(win32con.SM_ ...
分类:
编程语言 时间:
2019-09-14 22:16:36
阅读次数:
112
七个基本必背函数 join 将设置字符插入目标字符串中每个字符中间 split 按既定字符将目标字符串内全部对应分割,默认从左开始,可指定分割次数(分割后对应分割符不会返回) find 从前往后在既定右开区间内寻找指定字符串,找不到输出-1。返回的是绝对位值 strip 左右同时开始向中间祛设置字符 ...
分类:
编程语言 时间:
2019-09-14 18:35:03
阅读次数:
105