码迷,mamicode.com
首页 > 其他好文 > 详细

比较准确完整的中文字符正则校验

时间:2018-11-08 12:14:49      阅读:168      评论:0      收藏:0      [点我收藏+]

标签:文字   highlight   java   测试   div   common   www   mon   ring   

网上大多数校验中文的正则都是\u4e00-\u9fa5,经过实际测试,这个正则无法匹配中文标点,如(),。等

仔细研究了unicode的规范,本着尽量宽泛、遵循unicode分类的原则,总结了一套比较准确完整的校验规则:
 
// http://www.unicode.org/charts/PDF/U2000.pdf 一般标点
// http://www.unicode.org/charts/PDF/U3000.pdf CJK符号和标点
// http://www.unicode.org/charts/PDF/U4E00.pdf CJK统一表意文字
// http://www.unicode.org/charts/PDF/UFF00.pdf 半宽全宽形状
String COMMON_STRING_REGEX = "[\u2000-\u206f\u3000-\u303f\u4e00-\u9fef\uff00-\uffef]*";

  

比较准确完整的中文字符正则校验

标签:文字   highlight   java   测试   div   common   www   mon   ring   

原文地址:https://www.cnblogs.com/demonbug/p/9928231.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!