码迷,mamicode.com
首页 > 其他好文 > 详细

关于文件的BOM头

时间:2021-05-04 16:35:28      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:width   img   big   开头   article   -o   间隔   blank   字节流   

什么是BOM头

Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。在UCS 编码中有一个叫做 "Zero Width No-Break Space",中文译名作“零宽无间断间隔”的字符,它的编码是 FEFF。而 FFFE 在 UCS 中是不存在的字符,所以不应该出现在实际传输中。UCS 规范建议我们在传输字节流前,先传输字符 "Zero Width No-Break Space"。这样如果接收者收到 FEFF,就表明这个字节流是 Big-Endian 的;如果收到FFFE,就表明这个字节流是 Little- Endian 的。因此字符 "Zero Width No-Break Space" (“零宽无间断间隔”)又被称作 BOM(即Byte Order Mark)。
UTF-8以字节为编码单元因此不需要 BOM 来表明字节顺序,但可以用 BOM 来表明编码方式。字符 "Zero Width No-Break Space" 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流,就知道这是 UTF-8编码了。

技术图片 技术图片

上面图片以editplus为例。

会造成的问题

可能有一些软件不能识别BOM头,如PHP,读取时会将这3个字符当做文件内容,造成文件内容错误。

去除BOM头

技术图片 技术图片

文件另存为时选择不带BOM头的UTF8编码就可以了。

参考

到底什么是UTF-8 BOM头
BOM头的产生、会造成的问题、和解决办法
什么是文件的BOM头,及BOM头有哪些坑?

关于文件的BOM头

标签:width   img   big   开头   article   -o   间隔   blank   字节流   

原文地址:https://www.cnblogs.com/strongmore/p/14726834.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!