方法一:根据ASCII码转换 ,GB2312库对多音字也无能为力。
GB2312标准共收录6763个汉字,不在范围内的汉字是无法转换,如:中国前总理朱镕基的“镕”字。
GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
01-09区为特殊符号。
16-55区为一级汉字,按拼音排序。(3755个)
56-87区为二级汉字,按部首/笔画排序。(3008个)
10-15区及88-94区则未有编码。
占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE...
分类:
Web程序 时间:
2014-10-20 15:11:08
阅读次数:
325
1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集——基本集》,这个字符集是目前国内所有汉字系统的统一标准。它规定了用两个字节来表示一个汉字,每个字节都只能使用低7位,共有128*128种状态,又由于ASCII中的控制代码在汉字系统中也要使用,所以只剩下94*94=8836种状态用来表示国标码规定的6763个汉字和682个全角...
分类:
其他好文 时间:
2014-10-09 15:40:38
阅读次数:
218
转换获取一个汉字的拼音首字母。 GB码两个字节分别减去160,转换成10进制码组合就可以得到区位码例如汉字“你”的GB码是0xC4/0xE3,分别减去0xA0(160)就是0x24/0x430x24转成10进制就是36,0x43是67,那么它的区位码就是3667,在对照表中读音为‘n’。XML布局 ...
分类:
其他好文 时间:
2014-08-21 16:26:44
阅读次数:
235
转换 获取一个汉字的拼音首字母。 GB码两个字节分别减去160,转换成10进制码组合就可以得到区位码例如汉字“你”的GB码是0xC4/0xE3,分别减去0xA0(160)就是0x24/0x430x24转成10进制就是36,0x43是67,那么它的区位码就是3667,在对照表中读音为‘n’。XML布局...
分类:
移动开发 时间:
2014-08-05 13:25:00
阅读次数:
339
一、汉字区位码与机内码1、区位码 为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了第一个汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。 所有的国标汉字与符号组成一个94×94的.....
分类:
其他好文 时间:
2014-07-16 18:13:13
阅读次数:
520
/// /// 通过汉字区位码得到其首字母(小写)/// /// 汉字编码/// public string FirstLetter(int nCode) {if (nCode >= 1601 && nCode = 1637 && nCode = 1833 && nCode = 2078 && nC...
分类:
Web程序 时间:
2014-06-17 20:09:37
阅读次数:
198
方法一:根据ASCII码转换,GB2312库对多音字也无能为力。GB2312标准共收录6763个汉字,不在范围内的汉字是无法转换,如:中国前总理朱镕基的“镕”字。GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。01-09区为特殊符号。16-55区为一级汉字,按拼音排序。(3755个)56-87区为二级汉字,按部首/笔画排序。(3008个)10-15区...
分类:
Web程序 时间:
2014-05-15 06:50:21
阅读次数:
590