码迷,mamicode.com
首页 > 其他好文 > 详细

字符编码

时间:2017-05-08 12:36:51      阅读:108      评论:0      收藏:0      [点我收藏+]

标签:ascii   bsp   国际化   问题   odi   字符   gb2312   python3   字节   

简单记录一下字符编码的中国发展历程:

ASCII——一个字符占一个字节、8位,有256个码位,可以表示256个字符

GB2312——可以表示682个字符,6763个汉字

GBK——23940个码位

GB18030——两万七千多码位

Unicode——一个字符占两个字节

UTF-8——原来ASCII所表示的字符不动,别的语言字符所占字节可伸长

Python2版本用的是ASCII码,所以是不支持中文的,所以在Python2中写程序时在开头要加上# -*- coding: utf-8 -*-,告诉Python解释器别用ASCII处理,用UTF-8处理

在Python3版本中用的是UTF-8,支持中文

 

字符编码问题详细见一篇文章:《中文化和国际化问题权威解析之一 字符编码发展历程》


 

 

字符编码

标签:ascii   bsp   国际化   问题   odi   字符   gb2312   python3   字节   

原文地址:http://www.cnblogs.com/sunnnyy37/p/6824021.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!