码迷,mamicode.com
首页 > 编程语言 > 详细

Java中文字符所占的字节数

时间:2018-02-09 20:49:15      阅读:164      评论:0      收藏:0      [点我收藏+]

标签:post   情况   span   ring   注意   使用   name   set   因此   

        Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312或GBK编码方式时,一个中文字符占2个字节;而采用UTF-8编码方式时,一个中文字符会占3个字节。我们可以通过String类的getBytes(String charsetName)方法来获取到字符串以指定编码方式编码后所得到的字节数组,然后字节数组的长度就是该字符串在指定编码方式下所占的字节数。

【测试示例】

public class Test {
    public static void main(String []args) throws UnsupportedEncodingException {
        // 运行结果:2
        System.out.println("测试".getBytes("ISO8859-1").length);
        // 运行结果:4
        System.out.println("测试".getBytes("GB2312").length);
        // 运行结果:4
        System.out.println("测试".getBytes("GBK").length);
        // 运行结果:6
        System.out.println("测试".getBytes("UTF-8").length);
        }
}

【注意】String类的不带参数的getBytes()方法会以程序所运行平台的默认编码方式为准来进行转换,在不同平台下就会有不同的结果,因此建议使用指定编码方式的getBytes(String charsetName)方法。

Java中文字符所占的字节数

标签:post   情况   span   ring   注意   使用   name   set   因此   

原文地址:https://www.cnblogs.com/schiller-hu/p/8436475.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!