数据提取的概念和数据的分类 1. 什么是数据提取 简单的来说,数据提取就是从响应中获取我们想要的数据的过程 2. 爬虫中数据的分类 结构化数据:json,xml等 处理方式:直接转化为python类型 非结构化数据:HTML 处理方式:正则表达式、xpath 数据提取之json 1.为什么要复习js ...
分类:
其他好文 时间:
2018-08-01 22:14:07
阅读次数:
192
来源:https://www.cnblogs.com/moqing/p/5665126.html 例子(面试题中经常问到):找重复项最多的字符个数 split():字符串中的方法,把字符串转成数组。 sort():数组中的排序方法,按照ACALL码进行排序。 join():数组中的方法,把数组转换为 ...
分类:
Web程序 时间:
2018-07-28 23:31:17
阅读次数:
340
https://blog.csdn.net/xushichang/article/details/4041507 正则表达式控制Input输入内容 https://blog.csdn.net/xushichang/article/details/4041507 正则表达式控制Input输入内容 20 ...
分类:
Web程序 时间:
2018-07-27 20:58:43
阅读次数:
373
啥是正则表达式? 一个正则表达式(regular expression)就是包含正常字符串和特殊元字符(meta characters)或元序列(meta sequences)的字符串。正常字符串匹配它们自己。元字符和元序列是字符或表示数量、位置或字符类型的字符序列。 这里只是记录一下学习过程,学习 ...
分类:
Web程序 时间:
2018-07-25 16:16:11
阅读次数:
202
/* * js正则表达式 * js的利用正则的两种方式: * 1、test() 判断给定字符串中是否含有指定规则的字符串 * 2、exec() 在给定字符串中取出指定规则的字符串 */ var text = "assdfdstest_10_asTest20asd"; // 第一种:/../ 只匹配第... ...
分类:
Web程序 时间:
2018-07-13 22:22:37
阅读次数:
215
test方法 test方法介绍 test方法用于测试字符串参数中是否存在匹配正则表达式模式的字符串 test方法的使用 通过结果可以看出,如果测试字符串参数存在匹配正则表达式模式的字符串则返回true,否则返回false test方法的那些坑 当正则表达式使用了全局匹配时,test方法会出现如下的这 ...
分类:
Web程序 时间:
2018-07-11 00:56:13
阅读次数:
145
test 判断字符串是否符合规定的正则 exec 获取匹配的数据 例子: test例子 rep = /\d+/; //只要有数字就返回truerep.test("asdkfasdkf9999")truerep.test("asdkfasdkf")false rep = /^\d+$/; //全部是数 ...
分类:
Web程序 时间:
2018-07-10 20:08:24
阅读次数:
153
对象属性 常用对象属性主要有以下几种: 1.global: 是否全文搜索,默认false 2.ignore case:是否大小写敏感,默认是false 3.multiline:多行搜索,默认值是false 4.lastIndex:是当前表达式匹配内容的最后一个字符 5.source:正则表达式的文本 ...
分类:
Web程序 时间:
2018-07-09 23:44:04
阅读次数:
354
1.直接量 /\w+\d\w\b/.exec('hello5w'); 2.零宽断言 1.零宽度正预测先行断言 它断言自身出现的位置的后面能匹配表达式exp /(?=exp)/ 2.零宽度负预测后发断言 断言此位置的后面不能匹配表达式exp /(?!exp)/ 3.零宽度正回顾后发断言 断言自身出现的 ...
分类:
Web程序 时间:
2018-07-09 19:24:18
阅读次数:
156
1.js去除所有的空格,返回去除空格后的字符串 str.replace(/(^\s*)|(\s*$)/g, ""); 2.js判断是否是手机号 var reg = /^1[3|4|5|7|8|9][0-9]{9}$/; //验证规则 var flag = reg.test(user_mobile); ...
分类:
Web程序 时间:
2018-07-09 11:13:21
阅读次数:
209