码迷,mamicode.com
首页 > 其他好文 > 详细

utf-8 -> gbk

时间:2017-08-01 14:23:38      阅读:105      评论:0      收藏:0      [点我收藏+]

标签:replace   替换   问号   过滤   文本   acea   一个   ace   字符串   

当 把一个utf-8编码的网页转成gbk编码时,这个字符就变成讨厌的问号了(例如: 文本前出现 ? )

处理方法,就是在字符串以GBK编码写出之前,把这个字符替换掉:

str = str.replace(‘\u00A0‘, ‘ ‘);

彻底而保险的方法是过滤所有GBK不能表示的字符:

str = str.replaceAll("[^\u4E00-\u9FA5\u3000-\u303F\uFF00-\uFFEF\u0000-\u007F\u201c-\u201d]", " ");

utf-8 -> gbk

标签:replace   替换   问号   过滤   文本   acea   一个   ace   字符串   

原文地址:http://www.cnblogs.com/chenyf/p/7267940.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!