一:selenium 库 selenium 每次模拟浏览器打开页面,xpath 匹配需要抓取的内容。可以,但是特别慢,相当慢。作为一个对技术有追求的爬虫菜鸡,狂补了一些爬虫知识。甚至看了 scrapy 框架,惊呆了,真棒! 网上很多关于 selenium 库的详细介绍,这里略过此方法。 二: req ...
分类:
编程语言 时间:
2019-09-24 14:16:16
阅读次数:
206
本文抽取证券之星基金的一个小表格为例(xpath的使用自己看菜鸟驿站)import requests from lxml import etree import csv def gethtml(url,headers): #获取网页text try: req = requests.get(url) ... ...
分类:
Web程序 时间:
2019-09-24 10:32:42
阅读次数:
100
<view class="uinfo"> <text class="sex" wx:if="{{req.sex==1}}">男</text> <text wx:else>女</text> <image class="sex" wx:if="{{req.sex==1}}" src="/images/p ...
分类:
微信 时间:
2019-09-20 12:38:16
阅读次数:
112
1、当 input 的 type 为 hidden 时,称其为隐藏域,隐藏域在页面中对于用户是不可见的,在表单中插入隐藏域的目的在于收集或发送信息,以利于被处理表单的程序所使用。浏览者单击发送按钮发送表单的时候,隐藏域的信息也被一起发送到服务器。 2、JSP 在处理提交过来的表单信息前,使用 req ...
分类:
Web程序 时间:
2019-09-19 21:28:13
阅读次数:
97
/** * 批量下载为zip * @param req * @param response * @param keyList oss文件路径集合 * @param fileName 下载出来的zip文件名(一般以合同名命名) 如:测试合同,zip */ public static void down... ...
分类:
编程语言 时间:
2019-09-10 13:11:57
阅读次数:
190
一、使用String进行数据重新编写 username = new String(username.getBytes("ios8859-1"),"utf-8"); 二、使用公共配置 1、get方式: 步骤一:req.setCharacterEncoding("utf-8"); 步骤二:在tomcat ...
分类:
其他好文 时间:
2019-09-09 22:36:41
阅读次数:
102
limit_req_zone $binary_remote_addr zone=mylimit:10m rate=1r/s localhost ~\.php$ { limit_req zone=mylimit burst=1 nodelay; try_files $uri =404; ....... ...
分类:
其他好文 时间:
2019-09-03 16:47:18
阅读次数:
83
Servlet 的生命周期(1) 结论:从第一次被调用到服务器关闭。 无论Tomcat服务器开辟了多少个线程,servlet只会创建一个对象,去调用service方法,因为不同线程的传入的形参req、rep不一样,所以结果也是不一样的。 Servlet 的生命周期: * 1.结论:从第一次被调用到服 ...
分类:
其他好文 时间:
2019-09-02 09:39:43
阅读次数:
55
使用别人项目或者给别人自己项目时,为避免版本问题把安装的包也给别人 导出项目所安装的包: 命令:pip freeze > requirements.txt 注意:requirements.txt的内容是项目所安装的包; 快速安装Django项目所需要的包: 命令:pip install -r req ...
分类:
其他好文 时间:
2019-08-30 17:28:28
阅读次数:
90
1. 安装 2. app.post('/test', function(req, res) { console.log(req.body); }); ...
分类:
其他好文 时间:
2019-08-30 09:20:45
阅读次数:
62