从GB2312、GBK 到 GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为 0。按照程序员的称呼,GB2312、GBK 到 GB18030 都属于双字节字符集 (DBCS)。
以下是这四种字符集的包含关系:GB2312...
分类:
其他好文 时间:
2015-07-07 19:33:54
阅读次数:
174
源:汉字与区位码互转(天天使用的String存储的是内码),几个常见汉字编码,附有读书笔记对GBK的理解(内附全部字符编码列表):扩充的2万汉字低字节的高位不等于1,而且还剩许多编码空间没有利用
分类:
其他好文 时间:
2015-07-02 19:20:25
阅读次数:
102
介绍下编码基础知识1 GB2312-80GB 2312 或 GB 2312-80 是中国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,又称GB0,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国...
分类:
其他好文 时间:
2015-06-19 13:10:53
阅读次数:
142
1 Unicode编码表
Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,...
分类:
其他好文 时间:
2015-06-14 15:11:26
阅读次数:
457
1Unicode编码表 Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制...
分类:
其他好文 时间:
2015-06-14 15:05:22
阅读次数:
435
引用自:http://blog.csdn.net/jerry_bj/article/details/5714745GBK、GB2312、iso-8859-1之间的区别GB2312,由中华人民共和国政府制定的,简体汉字编码规范,大陆所有计算机中的简体中文,都使用此种编码格式。目前,我也不知道还有另外的...
分类:
编程语言 时间:
2015-05-26 00:02:45
阅读次数:
249
http://blog.csdn.net/zixu/archive/2008/01/15/2045164.aspx 原文连接一、汉字编码1. 区位码 在国标GD2312—80中规定,所有的国标汉字及符号分配在一个94行、94列的方阵中,方阵的每一行称为一个“区”,编号为01区到94区,每一列称为一个...
分类:
其他好文 时间:
2015-05-14 15:42:46
阅读次数:
105
最近在给一个香港学生做毕设,要求生成随机繁体汉字。慕课网视频讲了如何生成简体汉字,其实繁体汉字也很简单。废话不说上代码
生成简体汉字
/**
* 生成随机简体汉字
*
* @return
*/
private char getRandomChar() {
String str = "";
int hightPos;
int lowPos;
Random ra...
分类:
其他好文 时间:
2015-04-29 13:35:23
阅读次数:
739
图书馆客户端项目中遇到的一个问题,得到的URL 是这样的
String baseurl = "http://innopac.lib.xjtu.edu.cn/availlim/search~S1*chx?/X{u848B}{u4ECB}{u77F3}&searchscope=1&SORT=DZ/X{u848B}{u4ECB}{u77F3}&searchscope=1&SORT=DZ&exte...
分类:
其他好文 时间:
2015-04-22 07:15:39
阅读次数:
211
首先,解释一下字符集:汉字编码:* GB2312字集是简体字集,全称为GB2312(80)字集,共包括国标简体汉字6763个。 * BIG5字集是台湾繁体字集,共包括国标繁体汉字13053个。 * GBK字集是简繁字集,包括了GB字集、BIG5字集和一些符号,共包括21003个字符。 * GB180...
分类:
系统相关 时间:
2015-04-16 11:52:28
阅读次数:
272