码迷,mamicode.com
首页 > 其他好文 > 详细

UTF-8 BOM

时间:2015-07-03 12:07:35      阅读:145      评论:0      收藏:0      [点我收藏+]

标签:

BOM也是Unicode标准的一部分,有它特定的适用范围。
通常BOM是用来标示Unicode纯文本字节流的,用来提供一种方便的方法让文本处理程序识别读入的文本文件是哪个Unicode编码(UTF-8,UTF-16BE,UTF-16LE)   
技术分享
技术分享 
 
Windows相对其他系统,对BOM处理比较好,是因为Windows把Unicode识别代码集成进了API里,主要是CreateFile()。打开文本文件时它会自动识别并剔除BOM。
Windows用这个有历史原因,因为它最初脱胎于多代码页的环境(ANSI环境)。     
而引入Unicode时Windows的设计者又希望能在用户不注意的情况下同时兼容Unicode和非Unicode(Multiple byte)文本文件,就只能借助这种小trick了。
 
似乎也真就Windows坚持用BOM了。。。。
 
在网页上使用BOM是个错误。BOM设计出来不是用来支持HTML和XML的。要识别文本编码,HTML有charset属性,XML有encoding属性
UTF-8 的网页代码不应使用 BOM,否则常常会出错。
 
Vim
设置带BOM    :set bomb
设置不带BOM   :set nobomb

UTF-8 BOM

标签:

原文地址:http://www.cnblogs.com/xiaokuang/p/4618092.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!