awk非常的优秀,运行效率高,而且代码简单,对格式化的文本处理能力超强。基本上grep和sed能干的活awk全部都能干,而且干得更好。先来一个很爽的例子:文件a,统计文件a的第一列中是浮点数的行的浮点数的平均值。用awk来实现只需要一句话就可以搞定(当然,这个东东用python也可以很轻松的实现,只...
分类:
其他好文 时间:
2014-07-22 23:15:12
阅读次数:
486
-------------------------linux常用头文件如下:POSIX标准定义的头文件
目录项 文件控制 文件名匹配类型 路径名模式匹配类型 组文件 网络数据库操作 口令文件 正则表达式 TAR归档值 终端I/O 符号常量 文件时间
字符扩展类型-------------------...
分类:
其他好文 时间:
2014-07-22 23:08:35
阅读次数:
397
使用正则表达式,对QQ群聊天记录进行解析,用于分析日期、成员等维度发言情况。
原始文本是2014-03-28 15:04:25 №┽◎Eagle(369029696) 解析之后yyyy=2014mm = 03dd = 28hh =
15mi =04ss = 25nick = №┽◎Eagleqq =...
分类:
编程语言 时间:
2014-05-01 15:44:08
阅读次数:
388
作者:zccst思想原理:把字符串分割为数组,粒度为每一个字符。循环该数组,用正则替换原字符串对于字符,并计算替换前后字符串长度差值,即为该字符出现的次数。另外,还可以对重复次数进行排序。用到的知识点:1,正则表达式。基本写法,RegExp,replace的用法。2,数组中的sort。自定义函数排序...
分类:
其他好文 时间:
2014-05-01 14:49:08
阅读次数:
376
1、if指令所有的nginx内置变量都可以通过if指令和正则表达式来进行匹配,并且根据匹配结果进行一些操作,如下:if
($http_user_agent ~ MSIE) { rewrite ^(.*)$ /msie/$1 break;}if ($http_cookie ~*
"id=([^...
分类:
其他好文 时间:
2014-05-01 13:08:26
阅读次数:
418
电话号码和手机的正则表达式:var reg =
/(^(\d{3,4}-)?\d{7,8})$|(^0?(13[0-9]|15[012356789]|18[0-9]|14[57])[0-9]{8})$/;此处已基本满足当前所有的电话号码和手机号码,包括181号码段和184号码段的,如果以后新推出号码...
分类:
移动开发 时间:
2014-05-01 12:51:34
阅读次数:
931
无捕获分组当你要将一部分规则作为一个整体对它进行某些操作,比如指定其重复次数时,你需要将这部分规则用(?:)把它包围起来。分支条件在正则表达式中,分支条件是一个很常用的条件。满足条件A
或者 满足条件B ,这个时候我们就可以使用分支条件了。分支条件使用的符号为 |代码示例:我们突然发现,...
分类:
编程语言 时间:
2014-05-01 10:05:33
阅读次数:
435
W3School
中有关于正则表达式的全面介绍:http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp1、什么是正则表达式?正则表达式有什么用?
知道正则表达式有什么用,是学习它的最好动力。 正则表达式跟平时用的字符串操作功能函数类似。功能比它强....
分类:
编程语言 时间:
2014-05-01 02:35:55
阅读次数:
423
理解linux sed命令(2010-02-27 18:21:20)
标签:linuxshellsed替换 分类:革命本钱 1. Sed简介sed是一种在线编辑器,它一次处理一行内容。处理时,把当
前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲...
分类:
系统相关 时间:
2014-05-01 01:18:57
阅读次数:
726
paip.元数据驱动的转换-读取文件行到个list理念 uapi java php python总结
#两个思路
1.思路如下:使用file_get_contents()获取txt文件的内容,然后通过explode()把获得的字符串转化为数组。获得数组长度可以使用count()函数
2.使用按照行读取api
在正则表达式中,有一个\n是newline的意思,又有一个\r是carri...
分类:
编程语言 时间:
2014-04-28 10:46:40
阅读次数:
304