字符集 字数 Unicode 编码 基本汉字 20902字 4E00-9FA5 基本汉字补充 38字 9FA6-9FCB 扩展A 6582字 3400-4DB5 扩展B 42711字 20000-2A6D6 扩展C 4149字 2A700-2B734 扩展D 222字 2B740-2B81D 康熙部 ...
分类:
其他好文 时间:
2017-09-07 13:21:01
阅读次数:
801
GBK编码范围:8140-FEFE,汉字编码范围见第二节:码位分配及顺序。 GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字( ...
分类:
其他好文 时间:
2017-08-20 16:49:41
阅读次数:
3323
GB2312 收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个 每个符号都用两个字节表示,每个字节均采用七位编码表示,习惯上 第一个字节是高字节,第二个字节是低字节 GB2312的编码范围为2121H-777EH,与ASCII有重叠,通行方法是将GB码两个字节的最高位置 ...
分类:
其他好文 时间:
2017-08-19 12:59:21
阅读次数:
570
判断一个字符是不是汉字通常有三种方法: [1] 用 ASCII 码判断;[2] 用汉字的 UNICODE 编码范围判断;[3] 用正则表达式判断。 1、用ASCII码判断 在 ASCII码表中,英文的范围是0-127,而汉字则是大于127,具体代码如下: 2、用汉字的 UNICODE 编码范围判断 ...
常被提起中文编码范围[/u4E00-/u9FA5]但随便复制了个韩文下来,或者'お',都不行。然后把范围扩大到^[/u2E80-/u9FFF]+$,这样倒是都通过了,应该就是匹配中日韩文字的正则表达式了,包括臺灣使用的繁體字。而关于中文的正则表达式,应该是^[/u4E00-/u9FFF]+$,和常被 ...
分类:
其他好文 时间:
2017-06-09 18:16:33
阅读次数:
303
原文地址:http://blog.csdn.NET/xzl04/article/details/6307416 [javascript] view plain copy 0000-007F:C0控制符及基本拉丁文 (C0 Control and Basic Latin) 0080-00FF:C1控制 ...
分类:
其他好文 时间:
2017-06-06 18:53:57
阅读次数:
334
1.GBK码位分布图 2.GBK码位说明 GBK 亦採用双字节表示,整体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,当中汉字(包含部首和构件)21003 个,图形符号 ...
分类:
其他好文 时间:
2017-05-28 10:58:38
阅读次数:
1237
Latin1是ISO-8859-1的别名,有些环境下写作Latin-1。ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。 Latin1是ISO-8 ...
分类:
其他好文 时间:
2017-05-23 12:21:09
阅读次数:
142
二维码,是一种采用黑白相间的平面几何图形通过相应的编码算法来记录文字、图片、网址等信息的条码图片。如下图 二维码的特点: 1. 高密度编码,信息容量大 可容纳多达1850个大写字母或2710个数字或1108个字节,或500多个汉字,比普通条码信息容量约高几十倍。 2. 编码范围广 该条码可以把图片、 ...
分类:
编程语言 时间:
2017-04-20 10:13:13
阅读次数:
141