码迷,mamicode.com
首页 > 编程语言 > 详细

javascript 字符串进行 utf8 编码的方法(转)

时间:2017-10-20 10:15:17      阅读:1421      评论:0      收藏:0      [点我收藏+]

标签:ace   func   定义   param   bytes   ++i   return   返回   链接   

实践中碰到了一个大问题,在 javascript 中,可能有一些中文字符串,我们想将其进行二进制流编码的时候,需要将其转换为 utf8 的编码。

也就是说,输入的是一个字符串:‘呆滞的慢板今天挣了100块钱‘

输出的是一个字节序列:

[229, 145, 134, 230, 187, 158, 231, 154, 132, 230, 133, 162, 
230, 157, 191, 228, 187, 138, 229, 164, 169, 230, 140, 163, 
228, 186, 134, 49, 48, 48, 229, 157, 151, 233, 146, 177]

又或者是这一个单字节的字符串:

"\xE5\x91\x86\xE6\xBB\x9E\xE7\x9A\x84\xE6\x85\xA2\xE6\x9D\xBF\xE4\xBB\x8A\xE5\xA4\xA9\xE6\x8C\xA3\xE4\xBA\x86100\xE5\x9D\x97\xE9\x92\xB1"
"???????????¢???????¤???£?o?100???é?±"

经过不懈的折腾,终于搞明白了,有两种解决方案:

1. 支持 window.TextEncoder() 的情况

function str2utf8(str) {
    encoder = new TextEncoder(‘utf8‘);
    return encoder.encode(str);
}

这种返回的是一个整数数组。

2. 利用 encodeURI 的编码进行替换

原理是,如果使用 encodeURI(str),其中如果碰到中文字符之类的,就会按照 utf8 编码之后变成 %E5%91 这个样子,我们利用这个,完了之后再将 % 替换成 \x,就得到了单个字节的串。

function str2utf8(str) {
    return eval(‘\‘‘+encodeURI(str).replace(/%/gm, ‘\\x‘)+‘\‘‘);
}

3. 综合使用

于是,我们综合来定义一个兼容的方案:

var str2utf8 = window.TextEncoder ? function(str) {
    var encoder = new TextEncoder(‘utf8‘);
    var bytes = encoder.encode(str);
    var result = ‘‘;
    for(var i = 0; i < bytes.length; ++i) {
        result += String.fromCharCode(bytes[i]);
    }
    return result;
} : function(str) {
    return eval(‘\‘‘+encodeURI(str).replace(/%/gm, ‘\\x‘)+‘\‘‘);
}

【转载请附】愿以此功德,回向 >>

原文链接:http://www.huangwenchao.com.cn/2015/09/javascript-utf8-encoding.html【javascript 字符串进行 utf8 编码的方法】

javascript 字符串进行 utf8 编码的方法(转)

标签:ace   func   定义   param   bytes   ++i   return   返回   链接   

原文地址:http://www.cnblogs.com/zhangdaicong/p/7696738.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!