最近在解析HTML文件,遇到这样的一个场景。我需要将HTML文件中data-url="xxx"中的xxx查找并显示出来。首先考虑使用find,但是find只能显示包含查找内容的文件名,不符合场景的需要。接着考虑使用grep,配合-o参数,确实可以显示匹配到的内容,但是grep正则的时候,总是贪婪匹配...
分类:
其他好文 时间:
2014-11-12 22:51:39
阅读次数:
266
集团的网站头部导航要整体更换统一,然后做好后分城市上传到站点。由于城市比较多,做了一个应用程序读下来不同的项目网站在线上读下来,不一样的部分,正则匹配替换,然后生成本地的htm文件。一番折腾后,生成的文件模样差不多了。然后导航栏有一个登陆,各个项目的登陆逻辑不一样,所以这部分是替换的内容。然后问题....
分类:
Web程序 时间:
2014-11-12 00:33:50
阅读次数:
179
1.#!/bin/sh 使用sh程序来执行下边的代码 #!/bin/more 输出下边的代码 #!/bin/可执行程序 下边的代码将会作为此程序的输入2. * 可以用来匹配文件名,正则匹配,作为乘法。**还可以作为幂运算3.(( 代码)) 即可以做数学运算,也可以在里面添加c代码4.$可以是代表一个...
分类:
系统相关 时间:
2014-11-10 19:22:32
阅读次数:
151
昨天对长目标字符串下的各种正则匹配库性能进行了总结,得出结论是Boost regex性能最佳。今天将其应用到项目当中,果不其然,长字符串匹配带来的性能损失基本没有了,当然,目前规模并不算太大,但是在可预计规模内Boost可以完全达到要求。...
分类:
其他好文 时间:
2014-11-07 17:04:51
阅读次数:
209
在最近的一个项目中,发现之前的正则匹配模块对于长字符串匹配性能损失比较厉害,因此对长字符串下的各种正则匹配进行了略微研究并附有实例。本文参考了博客http://www.cnblogs.com/pmars/archive/2012/10/24/2736831.html(下文称文1),这篇文章也是对三种regex库进行了比较,但有些地方我还有一些自己的见解,特此罗列如下,感谢这篇文章的作者。...
分类:
编程语言 时间:
2014-11-06 20:10:19
阅读次数:
337
众所周知,使用JS的正则对中文进行验证时,可以使用: /[\u4e00-\u9fa5]+/.test(‘中文‘) 但是在VIM中再使用这个正则时,则会提示无法找到匹配项 E384: 已查找到文件开头(结尾)仍找不到[\u4e00-\u9fa5]+ 实际上...
分类:
系统相关 时间:
2014-11-06 17:57:10
阅读次数:
738
分享一个Python实现的Bing图片下载器。下载首页图片并保存到到当前目录。其中用到了正则库re以及Request库。大致流程如下:1、Request抓取首页数据2、re正则匹配首页图片URL3、再次使用Request下载图片数据源码:#--*--encoding:UTF-8--*--"""bin...
分类:
编程语言 时间:
2014-11-02 22:20:38
阅读次数:
196
location匹配规则~ #波浪线表示执行一个正则匹配,区分大小写~* #表示执行一个正则匹配,不区分大小写!~和!~* #分别为区分大小写不匹配及不区分大小写不匹配^~ #^~表示普通字符匹配,如果该选项匹配,只匹配该选项,不匹配别的选项,一般用来匹配目录= ...
分类:
其他好文 时间:
2014-10-31 18:43:06
阅读次数:
213
区号+座机号码+分机号码:regexp="^(0[0-9]{2,3}\-)?([2-9][0-9]{6,7})+(\-[0-9]{1,4})?$"手机(中国移动手机号码):regexp="^((\(\d{3}\))|(\d{3}\-))?13[456789]\d{8}|15[89]\d{8}"所有手...
分类:
编程语言 时间:
2014-10-31 15:06:55
阅读次数:
409
1 location 的匹配符1.1 等于匹配符:=等于匹配符就是等号,特点可以概括为两点:精确匹配不支持正则表达式1.2 空匹配符空匹配符的特点是:匹配以指定模式开始的 URI不支持正则表达式1.3 正则匹配符:~正则匹配符是可以使用正则表达式的匹配符。不过这里要强调的是,一般来说~是指:区分大小...
分类:
Web程序 时间:
2014-10-22 20:08:24
阅读次数:
170