爬虫数据的提取 1. 正则表达式 1. 规则 不同语言不同,比如js中的正则表达式 转移字符. \ 2. Re模块 1. compile 2. findall 返回列表 3. search 4. match 5. sub 替换 返回结果字符串 3. 正则会在最后的字符串提取时起作用 2. jsonp ...
分类:
其他好文 时间:
2019-12-09 17:11:56
阅读次数:
102
61.思路:bin# 编写一个函数,输入是一个无符号整数,返回其二进制表达式中数字位数为 ‘1’ 的个数(也被称为汉明重量)。# 示例 1:# 输入:00000000000000000000000000001011# 输出:3# 解释:输入的二进制串 000000000000000000000000 ...
分类:
其他好文 时间:
2019-12-09 01:00:35
阅读次数:
111
主要有四个方法: search : 从字符串的任意位置开始检索,首次匹配即结束 findall : 全部匹配 sub : 将正则匹配结果进行替换 split : 根据正则匹配结果将字符串进行切分,然后返回一个列表 import re ''' search 从字符串的任意位置搜索匹配,检索到第一个匹配 ...
分类:
其他好文 时间:
2019-12-06 23:33:00
阅读次数:
139
public Page<User> findByConditions(UserCriteria, Pageable page) { Page<Item> page = itemRepository.findAll((root, criteriaQuery, criteriaBuilder) -> { ...
分类:
编程语言 时间:
2019-12-05 18:44:22
阅读次数:
425
今天再爬虫的正则表达式里纠结了很久,记录下来,防止忘记再浪费时间 content = requests.get(url) m=re.findall(r'<a href=\"([0-9a-zA-Z\_\/\.\%\?\=\-\&]+)\"',content.text,re.I) 一开始,我把conte ...
分类:
其他好文 时间:
2019-11-30 00:02:44
阅读次数:
71
https://www.cnblogs.com/clamp7724/p/11757304.html 之前做的ssm结构的小练习,结合这个看比较好。 1. @Controller 控制器, 添加给controller(servlet)层 2. @Service 服务,添加给service(业务逻辑)层 ...
分类:
编程语言 时间:
2019-11-23 19:45:34
阅读次数:
60
os模块:os.remove() 删除文件 os.unlink() 删除文件 os.rename() 重命名文件 os.listdir() 列出指定目录下所有文件 os.chdir() 改变当前工作目录os.getcwd() 获取当前文件路径os.mkdir() 新建目录os.rmdir() 删除空 ...
分类:
编程语言 时间:
2019-11-22 17:52:18
阅读次数:
58
@[toc]简介优点后端根据swagger语法,自动生成漂亮规范的接口文档。做交互测试。劣势侵入式的,影响程序运行,尤其是传参的时候。注意swagger分1.2版本和2.0版本,差异较大。swagger1.2即swagger-ui;swagger2.0即springfox-swagger。本文介绍的使用方式是新的版本,即springfox-swagger。发布生产,关闭swagger,以防泄漏项目
分类:
编程语言 时间:
2019-11-21 18:32:02
阅读次数:
96
##re.findall()re.findall() 返回匹配成功的列表 注意:遇到子组的时候,返回的是子组内容列表>>> re.findall(r'a[A-Z]\S*','aBC aDE5464')['aBC', 'aDE5464'] 子组findall 返回的是子组内容列表>>>re.finda ...
分类:
其他好文 时间:
2019-11-19 14:13:06
阅读次数:
48
基础元字符| 类别 | 元字符 | 含义| | | | 匹配字符 | . [...] [^...] \d \D \w \W \s \S |单个: .任意一个非换行(\n)字符 [...]内任意一个 [^...]内除外的任意一个 \d任意一个数字 \D非数字 \w普通字符(数字字母汉子和_) \W非普 ...
分类:
其他好文 时间:
2019-11-19 13:49:52
阅读次数:
73