正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表达式并不仅限于某一种语言,但是在每个语言中有细微的差别。 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑 ...
分类:
其他好文 时间:
2020-07-19 00:33:39
阅读次数:
67
# Name the components on this agenta1.sources = r1a1.channels = c1 c2a1.sinks = k1 k2 #将数据流复制给所有channel#下边这句是默认的,不配置也可以#a1.sources.r1.selector.type = ...
分类:
Web程序 时间:
2020-07-18 19:54:00
阅读次数:
103
Python爬虫 # 开发思路 准备 - 分析网页内容-结合chrome开发者模式 爬取原始数据 HTTP库 提取/清洗数据 保存 # 引入包 urllib - 指定url 获取网页信息 bs4 - 解析网页 re - 正则表达式,文字匹配 xlwt - excel操作 sqlite3 - SQLi ...
分类:
编程语言 时间:
2020-07-18 15:31:42
阅读次数:
66
Python第三方库 jieba - 分词 matplotlib - 绘图 PIL - 图片处理 numpy - 矩阵运算 sqlite3 - sqlite数据库 Flask - web框架 urllib - URL处理,网页爬虫 bs4 - 解析文档-html re - 正则表达式,文字匹配 xl ...
分类:
编程语言 时间:
2020-07-18 15:31:09
阅读次数:
65
正则表达式修饰符 i : 忽略大小写 g : 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止 元字符 \d 查找数字 \s 查找空白字符 \n 查找换行符 \r 查找回车符 test() 它通过模式来搜索字符串,然后根据结果返回 true 或 false exec() 通过指定的模式(patt ...
分类:
其他好文 时间:
2020-07-17 22:18:59
阅读次数:
57
/** * 截取完整字符串中的host * @param {String} url 地址 * @returns {String} host */ export const GetHost = (url) => { url = url.match(/https?:\/\/([^/]+)\//i); l ...
分类:
Web程序 时间:
2020-07-17 19:18:17
阅读次数:
97
/** * 截取完整字符串中的host * @param {String} url 地址 * @returns {String} host */ export const GetHost = (url) => { url = url.match(/https?:\/\/([^/]+)\//i); l ...
分类:
Web程序 时间:
2020-07-17 16:10:00
阅读次数:
71
4.2 使用 Beautiful Soup 前面介绍了正则表达式的相关用法,但是一旦正则表达式写的有问题,得到的可能就不是我们想要的结果了。而且对于一个网页来说,都有一定的特殊结构和层级关系,而且很多节点都有 id 或 class 来作区分,所以借助它们的结构和属性来提取不也可以吗? 这一节中,我们 ...
分类:
其他好文 时间:
2020-07-17 13:46:41
阅读次数:
54
1.试用场景:正则中取的参数会在其他系统中用到,本系统将此参数保存成参数化文档,其他环境可以拿来直接用了,废话不多说,开搞! 首先正则表达式贴出来,变量名称al 接下来就是将al取到的值写到目标文件里 源码如下: import java.io.*;//import java.io.BufferedW ...
分类:
其他好文 时间:
2020-07-17 13:34:11
阅读次数:
79
// 验证规则 var validRegex = { letterOnly : /^[A-Za-z]+$/, numLetterOnly : /^[A-Za-z0-9]+$/, notBlank : /^[^\s]{1,}(.)*[^\s]{1,}$|^[^\s]{1}$/, //前后空格不要,中间 ...
分类:
其他好文 时间:
2020-07-17 11:27:22
阅读次数:
69