标签:style http os 使用 sp on 文件 bs tt
使用HttpClient抓取网页,一直乱码,发现字符编码是gb2312。一直怀疑自己的编码设置错误,一直不停的尝试去换编码。却不得结果。
在跟踪页面返回的头信息的时候如果发现:
Content-Encoding :gzip
原来启动了文件压缩。所以要先解压流信息: GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());
查询资料得知:
GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());
String s = EntityUtils.toString(zipRes, "gb2312");
done!!搞定
标签:style http os 使用 sp on 文件 bs tt
原文地址:http://my.oschina.net/payzheng/blog/356767