标签:
首先我们来看一张由eclipse生成的jsp文件的头:
图1:JSP文件编码
如上图所示jsp中的三个编码,
①代表的是服务器响应客户端请求的编码方式。服务器会用它来设置http响应头的content-type。就好比在Servlet中用response.setContentType("text/html;charset=utf-8")的作用。可以在浏览器的Header中响应头中的Content-Type中看到。
②pageEnconding的编码是值jsp文件本身被编码的编码格式。因为jsp最终会被编译成clss的字节码,而字节码是Unicode编码的,所以必须知道格式才能转换。如果没有设置,eclipse会按iso-8859-1的编码方式对其编码。如果1没有设置,那么就会使用2pageEncoding的编码来设置。
③中的content也是设置浏览器的解码格式的,但是它的优先级没有Header中的Content-Type优先级高,所以只要在Header中设置了Content-Type,那么就基本不会使用meta中的content了。
下面通过一个非常简单的例子来测试一下:
<%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> <title>encoding</title> </head> <body> <center> <h4>您好!</h4> </center> </body> </html>
非常简单,运行没有乱码。用Firefox的debug看一下请求头如下:
图2:Header1
如果您有兴趣,可以尝试着把图1中①的编码contentType去掉,发现还是没有乱码,查看响应头信息,Content-Type的编码依然是utf-8,这是因为如果没有设置图1中①的编码contentType默认使用的就是图1中②pageEncoding的编码方式。
还可以尝试着把③中的编码改为iso-8859-1之类的与中文不兼容的编码,发现仍然没有乱码,查看请求头信息Content-Type的编码依然是utf-8,并且比meta中编码的优先级高所以浏览器还是使用响应头中的utf-8的方式来解码。
现在我们把中①的编码contentType编码改为GBK,如下图:
图3:contentType-GBK
在Firefox debug中查看请求头信息Content-Type的编码,发现Content-Type的编码是GBK这样证明①的编码contentType是设置响应头中的Content_Type。但是奇怪的是并没有产生乱码,服务器明明是utf-8编码,响应头是GBK为什么没有出现乱码呢?暂时无解。
但是我们把中①的编码contentType编码改为iso-8859-1不兼容中文的编码方式,发现就出现乱码了。
关于图3中没有出现乱码的原因,也许我们能够从浏览器的解码过程中找到一些提示,请参考:
www.w3.org/html/wg/drafts/html/master/syntax.html#parsing-with-a-known-character-encoding
标签:
原文地址:http://my.oschina.net/u/2474629/blog/525056