码迷,mamicode.com
首页 > 编程语言 > 详细

Python中utf-8与utf-8-sig两种编码格式的区别

时间:2017-08-10 10:22:42      阅读:179      评论:0      收藏:0      [点我收藏+]

标签:decode   coding   字节序   string   顺序   char   rac   width   byte   

As UTF-8 is an 8-bit encoding no BOM is required and anyU+FEFF character in the decoded Unicode string (even if it’s the firstcharacter) is treated as a ZERO WIDTH NO-BREAK SPACE.

UTF-8以字节为编码单元,它的字节顺序在所有系统中都是一様的,没有字节序的问题,也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。

Python中utf-8与utf-8-sig两种编码格式的区别

标签:decode   coding   字节序   string   顺序   char   rac   width   byte   

原文地址:http://www.cnblogs.com/wangshuyi/p/7337266.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!