码迷,mamicode.com
首页 > 其他好文 > 详细

ALT+数字,可输入汉字 good

时间:2015-05-29 20:15:25      阅读:184      评论:0      收藏:0      [点我收藏+]

标签:

输入 ALT + 50385 就出 难 字了,原因是它的十六进制ANSI编码是C4D1=50385

同理:
汉=BABA=47802
字=D7D6=55254
中=D6D0=54992
文=CEC4=52932
国=B9FA=47610
华=BBAA=48042
夏=CFC4=53188
吴=CEE2=52962
但不知这种方法只支持GB2312,还是支持GBK,估计是GBK(即当前的ANSI编码)

这种方法还可输入ANSI和扩展ANSI:
A=65
€=128
À=192
æ=230


同时查得Unicode编码:
汉=FFFE49=16776777,输出结果却是:蘒
字=6C575B=7100251,输出结果却是:W
可见的这种输入方法不支持Unicode

----------------------------------------------------------
GBK定义之字符较CP936多出95字,皆为其时未收入ISO 10646 / Unicode之符号。CP936中的这95字分配到了Unicode的私有区域,现已全部收于新版Unicode。
因此,现在GBK的所有字符已经全部收录于Unicode中。

UTF-8作为Unicode的一种编码方法,可以表述所有的Unicode字符。
结论:UTF-8可以表述所有的GBK字符。


----------------------------------------------------------
GBK对应的code page是CP936。
微软也为GB18030定义了code page:CP54936

GBK是GB2312的扩展,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名。
在简体中文windows系统下,ANSI编码代表GBK/GB2312编码,ANSI通常使用0x80~0xFF范围的2个字节来表示1个中文字符。0x00~0x7F之间的字符,依旧是1个字节代表1个字符。Unicode(UTF-16)编码则所有字符都用2个字节表示。

ALT+数字,可输入汉字 good

标签:

原文地址:http://www.cnblogs.com/findumars/p/4539094.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!