标签:英文单词 中文字符 coding 单词 sci col 比特 gbk 统一
字符编码的区别与介绍
ASCII、GB2312、GBK、Unicode(统一码、万国码、单一码)
ASCII码1个字节占8个比特币,Unicode统一2个字节占16个比特币;
utf-8是Unicode的子集,可变长,所有的英文单词存的是ASCII码格式,中文字符是3个字节。
ASCII 255 1bytes---> 1980年 GB2312 7K+ ----> 1995年 GBK1.0 2W+ --->2000年 GB18030 2.7W ---> unicode 2bytes---> utf -8 en:1bytes,zh:3bytes
Python 3 默认支持中文, Python 2 默认ASCII码,不支持中文。
# -*- coding:utf-8 -*- 限定字符编码格式
--------------------------------------------------------------------------------
name = "你好,世界" print(name)
# -*- coding:utf-8 -*-
标签:英文单词 中文字符 coding 单词 sci col 比特 gbk 统一
原文地址:http://www.cnblogs.com/xiaobai005/p/7677880.html