码迷,mamicode.com
首页 > 其他好文 > 详细

提取文本当中的汉字

时间:2016-02-04 11:38:20      阅读:157      评论:0      收藏:0      [点我收藏+]

标签:

http://tool.chinaz.com/regex/

[\u4e00-\u9fa5]+\s*[,!?:]*[\u4e00-\u9fa5]+[,!?:]*

 

tool.chinaz>切额地方地,方!<.com|ddd//大声夺地d在在地  方!:88

[\u4e00-\u9fa5] : 表示一下汉字

+ 重复限定词: [1, 无限]

\s : 空格

*: 重复限定词:[0,无限](表达可能有空格,也可能没有空格)

[,!?:] * : 可能出现此类标点符号,也可能没有

[\u4e00-\u9fa5]+ 必须至少出现一人汉字

[,!?:]* 可能出现此类标点符号,也要吧没有

 

原则:

正则表达式当中每一个元素只代表一个字符的含义:

如[\u4e00-\u9fa5] 只表示只要是这个集合就OK

如果想表达多个 : 限定词 *, +

提取文本当中的汉字

标签:

原文地址:http://www.cnblogs.com/pengxinglove/p/5181151.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!