语言式学习
记关键字
if while for
解释名词
字符编码:翻译成特定格式
归类总结
无论什么程序,都肯定是CPU操作程序
文本编辑器:notpad++,word
isca码就是美国人用二进制来代表他们能看懂的字符
GBK就是中国人弄的,自己的文字,多偏僻的文字都可以表示
但是中国的问题解决了,其他国家的没解决
于是出现了unicode(所有的国家文字都可以在上面找到二进制代码)
但是美国人不开心了,于是在utf-8:可变长,英文字符一个字节,中文多个字节
ASCII码:127个数字,7个比特位 ------美国
扩展ASCII码:128个数字,8个比特位 ----拉丁,西欧
中文扩展ASCII码(GB2312):几千个状态 -----中国
中文扩展ASCII码(GBK):两万个状态 -----中国
UICODE:两个字节 -------6万多个状态----全世界
utf-8: 不同个数的字节对应不同国家的字符(二进制对应二进制)
软件包的编码(明文)是UICODE,不是utf-8
硬盘:容量和转速,一定要把UICODE变成utf-8
utf-8先解码为UICODE,再变成明文
python解释器是什么:
我们在txt写文字,可以在notepad++选什么编码存的,
保存选择用什么编码保存到磁盘中,然后就选什么编码来解码磁盘并读取。
#coding:utf8
python 2.x:
str:bytes数据 s="李杰"
unicode:unicode编码后的二进制数据 s2=u"李杰"