码迷,mamicode.com
首页 > 编程语言 > 详细

paip.utf-8,unicode编码的本质输出unicode文件原理 python

时间:2014-04-28 10:28:42      阅读:374      评论:0      收藏:0      [点我收藏+]

标签:blog   http   java   文件   c   line   

 paip.utf-8,unicode编码的本质输出unicode文件原理 python
 
 
 #别的语言,java php都是unicode,走十python不一样.
 
 #enddef
 #todo write to unicode encode
fileHandle = open ( r"c:\fmtSmpEnRst.txt", ‘w‘,encoding="UTF-16" )      


 #todox utf8 not decode...now  UTF-16是Unicode
    lines=file2list(f, encode="utf-16")
    
    作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com
转载请注明来源: http://blog.csdn.net/attilax


#原理



一般所谓的unicode 其实是utf-16,双字节或者4字节。

utf-8是多字节。

真正的unicode其实只是对文字的一个唯一编码,utf-8,utf-16都是这个编码到文件的一种实现方式。

 ,unicode和gbk是编码的值,而utf-8和utf-16是编码的表现形式

是的,unicode准确说是一个字符编码表,而utf-32,utf-16,utf-8是unicode这个字符编码表的传输方式。比如  UTF-8    


所以,甚至可以把utf-8,unicode,gbk理解成不同的编码,中间通过unicode转换,呵呵。

paip.utf-8,unicode编码的本质输出unicode文件原理 python,码迷,mamicode.com

paip.utf-8,unicode编码的本质输出unicode文件原理 python

标签:blog   http   java   文件   c   line   

原文地址:http://blog.csdn.net/attilax/article/details/24607657

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!