java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包。它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式。 Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式
分类:
编程语言 时间:
2016-02-15 16:12:54
阅读次数:
201
在古诗中,我们提取到了题目与作者在一起的数据,如 行宫(元稹) 里面的括号是英文括号,现在要分别提取出标题与作者。有两种方案: (1)通过split得到 String [] strArray = Pattern.compile("\\(|\\)").split("行宫(元稹)"); for (Str
分类:
编程语言 时间:
2016-02-13 12:12:41
阅读次数:
417
在做 Crawler的时候,本来是准备用正则的,但是看jsoup很好用,就没有学,刚刚在做古诗提取的时候,又要用到正则表达式,还是学了算了。 说明: 文章重点参考的http://www.cnblogs.com/ggjucheng/p/3423731.html,加上自己有一点理解。 正则表达式的语法可
分类:
编程语言 时间:
2016-02-13 00:25:48
阅读次数:
294
需求:提取车牌号中最后一个数字,如:宁A7865提取5,宁A876X提取6
实现方法:import java.util.regex.Matcher;
import java.util.regex.Pattern;public class Test { public static void main(String[] args) {
String s = "A876X";...
分类:
编程语言 时间:
2016-02-03 17:25:16
阅读次数:
349
需求:已知字符串为一数字字符形式,多为float,double转换过来,将其后多余的0与.去掉.package test; /** * 去掉多余的.与0 * @author Hust * @Time 2011-11-7 */ public class TestString { ...
分类:
编程语言 时间:
2016-01-25 15:02:56
阅读次数:
219
一、概述 正则表达式因为其强大的字符串处理能力,刚开始被被广泛地应用到各种UNIX工具中,如大家熟知的 Perl脚本语言 。后来正则表达式在各种 计算机语言 和各种应用领域得到了广泛的应用和发展,目前的主流操作系统(Linux, Unix、Windows等)、目前主流的开发语言( PHP 、 C#....
分类:
编程语言 时间:
2016-01-23 13:02:36
阅读次数:
147
1、Unicode码表。2、关于java正则表达式的汉字写法。(参见这里)Stringregex="[\\p{InCJKUnifiedIdeographs}&&\\P{Cn}]]";3、Python3中str与bytes转换:Thebytes/strdichotomyinPython3***walker***
分类:
其他好文 时间:
2016-01-11 18:32:22
阅读次数:
126
正则表达式语法:语法 解释字符:c |字符c\unnnn, \xnn,\0n,\0nn,\0nnn |具有给定十六进制或十进制的码元\t,\n,\r,\...
分类:
编程语言 时间:
2016-01-08 22:05:29
阅读次数:
266
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包。它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式。 Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式...
分类:
编程语言 时间:
2016-01-08 21:57:34
阅读次数:
273
前言:这是Java爬虫实战的第二篇文章,在第一篇文章仅仅只是抓取目标网站的链接的基础上,进一步提高难度,抓取目标页面上我们所需要的内容并保存在数据库中。这里的测试案例选用了一个我常用的电影下载网站(http://www.80s.la/)。本来是想抓取网站上的所有电影的下载链接,..
分类:
编程语言 时间:
2015-12-31 13:04:59
阅读次数:
575