from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait # 等待元素加载的 from selenium.webdriver.common.action_chains import A... ...
分类:
其他好文 时间:
2018-10-27 21:47:14
阅读次数:
258
1正则表达式import re# [] 范围匹配 中间 用-来连接# re.findall("[a-zA-Z0-9]","a ab abc abcd a123c")# 如果要匹配 符号- 要写表达式的左边或右边# print(re.findall("[-ab]","a ab abc abcd a12 ...
分类:
其他好文 时间:
2018-10-27 21:46:24
阅读次数:
222
import requests, refrom requests.exceptions import RequestExceptionlis = []head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64)' ' AppleWebKit/5 ...
在写框架时 经常需要扫描classpath指定包路径下带有某个Annotation的类,自己整理了一下 封装成一个工具类了,供大家参考。 源代码ClassPathResourceScanner.java 如下: package com.bytebeats.jupiter.ioc; import co ...
分类:
编程语言 时间:
2018-10-18 16:59:58
阅读次数:
266
背景介绍 公司最近的新项目在进行技术框架升级,基于的Spring Boot的版本是2.0.2,整合Redis数据库。网上基于2.X版本的整个Redis少之又少,中间踩了不少坑,特此把整合过程记录,以供小伙伴们参考。 本文的基于在于会搭建Spring Boot项目的基础上进行的,入门是小白的话,请自行... ...
分类:
编程语言 时间:
2018-10-18 16:48:38
阅读次数:
329
正则补缺 findall import re ? # 没有(),结果集中保存完整匹配的内容 # f = re.findall('abc', 'abcdasabcakdjklasjabc') # 与上面的情况等价 # f = re.findall('(abc)', 'abcdasabcakdjklas ...
分类:
其他好文 时间:
2018-10-17 22:14:06
阅读次数:
218
页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据 和 结构化的数据。 非结构化数据:先有数据,再有结构, 结构化数据:先有结构、再有数据 不同类型的数据,我们需要采用不同的方式来处理。 非结构化的数据处理 正则表达式 ...
分类:
其他好文 时间:
2018-10-13 11:39:51
阅读次数:
155
re 由Python提供的一套关于处理正则表达式的模块有以下四个核心功能: import re 1. findall # 查找所有 返回列表(list) 2. finditer # 和findall 差不多 这是是返回迭代器 3.search 会进行进行匹配 如果匹配到第一个结果, 就会返回这个结果 ...
分类:
其他好文 时间:
2018-10-11 22:36:33
阅读次数:
136
re findall() finditer() search() match() 正则:在python中()表示分组 (?:)去掉python的分组 (?P<名字> 正则) 把正则匹配到的内容分组成"名字"组2. 模块 import 模块名 1. 检查是否已经导入过 , 顺序, 内存-> 内置 -> ...
分类:
其他好文 时间:
2018-10-11 16:56:06
阅读次数:
188