标签:article head unicode编码 log lan alt footer utf-8 数字
计算机只认识0和1
那字符串“abc”咋显示呢? 有个类似于字典的东西,告诉计算机在此种情况(在此编码格式)下,某些数字该显示什么。
这种字典,就是字符集
目前主要有以下几种字符集:
共收录128个字符,都是些最最基础的字符。详情请看百度百科
大小:占一个字节
ASCII字符集的扩充。共收录256个字符。ASCII字符集基础上扩充了128个西欧常用字符(包括德法两国的字母)
大小:占一个字节
划重点:made in china。 百度百科~曰:”共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。“详情请看百度百科
兼容ASCII字符集。
大小:如果该字符在ASCII字符集中,则采用1字节编码。否则采用2字节编码。
划重点:made in china。 继GB2312字符集
之后中国又出的一套标准。这套更牛逼:不仅完全兼容GB2312字符集。还扩充了很多: ”共23940个码位,共收录了21003个汉字...全部中日韩汉字...“ 总之一个字:牛逼!
大小:如果该字符在ASCII字符集中,则采用1字节编码。否则采用2字节编码。
牛逼的玩意儿来了。先看看它的中文译名:统一码、万国码、单一码。 收录地球上的所有字符,现在还在不断扩充。 但是,需要注意的是,Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。
其中,Unicode编码规定的符号代码必须以”U+”做前缀。
编号怎么对应到二进制表示呢?有多种方案:主要有 UTF-8,UTF-16,UTF-32。
以上都是废话,记住下面的图就好了
参考文献:
互联网技术窝
或者加微信共同探讨交流:
标签:article head unicode编码 log lan alt footer utf-8 数字
原文地址:https://www.cnblogs.com/RyuGou/p/10778158.html