码迷,mamicode.com
首页 >  
搜索关键字:正则表达 正负 零宽断言    ( 17132个结果
Java爬虫
1.昨天复习了Java基础(I/O流)和正则表达式 今天不讲Java中的 I/O 主要用一个实例来爬取网站中的邮箱代码如下: 1 package com.miao.baba.pacong; 2 3 import java.io.BufferedReader; 4 import java.io.IO....
分类:编程语言   时间:2014-05-29 05:11:03    阅读次数:404
UVALive 4255 Guess
这道题目让我学到了很多一道不走寻常路的题目,给定一串数列的 和 的正负号,即假设数列 为 a1,a2,a3.....an,则一致了 Sij的正负号或者是否等于0,Sij代表了 从 ai 到 aj的和。要你求出任意一种序列,满足题目给定的Sij条件确实是看了白书上的思路都还不太知道怎么写,然后看了LR...
分类:其他好文   时间:2014-05-29 03:58:44    阅读次数:276
约束路由
1、用正则表达式约束路由有工程11-3URLTestDemo,如在Global.asax中有如下路由定义: public static void RegisterRoutes(RouteCollection routes) { routes.MapR...
分类:其他好文   时间:2014-05-28 21:07:42    阅读次数:377
时间正则表达式
yyyy-MM-dd HH:mm:ss 标准格式验证^((((1[6-9]|[2-9]/d)/d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]/d|3[01]))|(((1[6-9]|[2-9]/d)/d{2})-(0?[13456789]|1[012])-(0?[1-9]...
分类:其他好文   时间:2014-05-28 19:01:37    阅读次数:277
正则表达式/g/i/d
/g意思就是:global可选标志,带这个标志表示替换将针对行中每个匹配的串进行,否则则只替换行中第一个匹配串。如:we.fdffddfwe.加上/g后,则2个we都会出来;/i意思就是 case insensitive,区分大小写小字。如:sw与sW不管;/d意思是digital.是一个数字如:/...
分类:其他好文   时间:2014-05-27 16:57:49    阅读次数:234
使用正则表达式提取网页有效信息
从HTML页面提取内容所面临的主要问题是,我们必须寻找一种方法精确地识别出自己想要的那一部分内容。以下是利用正则表达式匹配并提取网页中特定信息的方法:采集网页中所有链接标记:]*?>[\s\S]*?以上可以修改a标记采集对应的标记元素。采集图片:]*?/?>以上可以修改img标记采集对应的标记元素。...
分类:Web程序   时间:2014-05-26 19:12:12    阅读次数:288
python实现图片爬虫
#encoding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf8') from sgmllib import SGMLParser import re import urllib class URLLister(SGMLParser): def start_a(self, attrs): url = [v ...
分类:编程语言   时间:2014-05-25 22:47:56    阅读次数:340
Java实现敏感词过滤
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢。我把它程序拿过来一看,整个过程如下:读取敏感词库、如果HashSet集合中,获取页面上传文字,然后进行匹配。我就想这个过程肯定是非常慢的。对于他这个没有接触的人来说我想也只能想到这个,更高级点就是正则表达式。但是非常...
分类:编程语言   时间:2014-05-25 21:26:01    阅读次数:386
Javascript正则表达式
正则表达式正则用来从字符串筛选出子字符串。简单使用编辑器搜索时,勾选上正则,可以搜索出满足特定条件的结果。\bfunction\b这样可以搜索出function单词。做搜索功能时 var reg = new RegExp(inpStr); apps.forEach(function (v, i).....
分类:编程语言   时间:2014-05-25 16:05:08    阅读次数:272
javascript 正则表达式
一、基础javascript允许你通过以下两种方式创建RegExp对象,1)直接量。2)使用RegExp()varpattern=/java$/;//直接量创建 varpattern=newRegExp("java$"); 二、元字符 正则表达式中,字母和数字都是按照字面意思进行匹配的,同时javascript也支持非字母的..
分类:编程语言   时间:2014-05-25 04:56:22    阅读次数:462
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!