后续爬虫代码的建议 尽量减少请求次数 1. 能抓列表页就不抓详情页 2. 保存获取的html页面,供差错和重复请求使用 关注网站的所有类型的页面 1. wap页面,触屏版页面 2. H5页面 3. APP 多伪装 1. 动态的UA 2. 代理ip 3. 不使用cookie 利用多线程分布式 在不被b ...
分类:
Web程序 时间:
2018-10-27 00:14:05
阅读次数:
204
chromedriver禁用图片,禁用js,切换UA selenium 模拟chrome浏览器,此时就是一个真实的浏览器,一个浏览器该加载的该渲染的它都加载都渲染,所以爬取网页的速度很慢。如果可以不加载图片等操作,网页加载速度就会快不少,代码中列出了了禁用图片,禁用JS,切换UA的方法。 from ...
分类:
编程语言 时间:
2018-10-25 17:09:23
阅读次数:
169
生命周期的钩子 LifeCycle hooks 执行顺序 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <met ...
分类:
其他好文 时间:
2018-10-24 15:13:17
阅读次数:
136
from:http://www.fynas.com/ua ...
分类:
其他好文 时间:
2018-10-16 18:40:00
阅读次数:
971
所谓二元一次不定方程,指的是关于$x,y$的,形如$ax+by=c$的方程在这里我们约定$a,b,c$均为整数。那么我们遇到的问题是:如何判断这个方程有解呢?裴蜀定理:设$a,b,d$均为整数,且$(a,b)=d$,则存在$u,v$使得$ua+vb=d$证明:由$(a,b)=d$知$且d|a且d|b ...
分类:
其他好文 时间:
2018-10-13 11:40:45
阅读次数:
199
js在用户输入表情时自动过滤掉 var noEmoji = function(dom) { var html = $(dom).val(), oldHtml = ""; oldHtml = html; var reg = /[^\u0020-\u007E\u00A0-\u00BE\u2E80-\uA... ...
分类:
其他好文 时间:
2018-10-11 18:57:07
阅读次数:
519
<!DOCTYPE html><html><head> <meta charset="utf-8"> <meta name="renderer" content="webkit"> <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome= ...
分类:
Web程序 时间:
2018-10-10 22:02:00
阅读次数:
199
虽然手机不像电脑那样会有各种低版本的浏览器,但写手机端网页也是需要注意的: <!-- 优先使用 IE 最新版本和 Chrome --> <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1"/> <!-- 页面描述 --> <met ...
分类:
移动开发 时间:
2018-09-27 22:14:19
阅读次数:
233
遨游浏览器:http://www.maxthon.cn/ 自定义 UserAgent : http://www.fynas.com/ua 手机UserAgent大全 ...
分类:
其他好文 时间:
2018-09-16 15:57:00
阅读次数:
441
随手记录查阅的资料,每天进步一点点。 今天有一个做开发的朋友突然问你知道很多网站上面加入的X-UA-Compatible属性的意义么?其实这个在以前还专门花了一点时间来验证我自己的想法,结果也确实如自己所预想的那样,八九不离十,当然有一点点的偏差。我做的项目中也并不是每个项目中都使用该属性。那么我们 ...
分类:
Web程序 时间:
2018-09-15 13:07:34
阅读次数:
160