标签:方法 学习java 之间 utf-8 发布 缺陷 asc 相互 理解
从C\C++\开始学编程的兄弟们肯定对char这个基本类型有深刻的理解。什么\0最为结束符,strlen和sizeof,字符串数组和char*的字符串,这部分基本上是学习C语言最先要面对的一个拦路虎。当然学习java、C#这些相对没有历史包袱的语言的时候,就不会感到这么坑爹了。
实际上,对不起各位的是,char这个类型作为描述字符的载体,还有着其他的问题。我们在下面简单说一些。(仅作为抛砖引玉,如果有什么缺陷,希望大家不吝赐教)
后来,大家发现了这个问题,对于一个程序,想要全球发布,就会面临很大的问题。所以后来人们就发明了另外一种码表-Unicode。顾名思义,Unicode是把世界上所有的字符,都包含进来的一个超级大的码表。Unicode的基本思想就是,我的表里面什么都有,无论在任何语言的任何系统,只要支持Unicode,就能在表里面找到想要的字符。当前Unicode使用的是UCS-2(16位的),可以容纳65535个字符,基本上也够用了。编码方式有utf-16、utf-32、utf-8。因为utf-8对之前的一些字符串函数兼容性更好,所以现在广泛使用的就是utf-8。
好了,到现在为止,我们一共提出了ASCII、亚洲的多字符编码、Unicode三种大的编码方式。那我们要怎么选择,以及他们相互之间要怎么切换哪?等我有时间再说。
标签:方法 学习java 之间 utf-8 发布 缺陷 asc 相互 理解
原文地址:http://www.cnblogs.com/KKKEr/p/6838914.html