码迷,mamicode.com
首页 > 其他好文 > 详细

3.6.6 码点与代码单元

时间:2018-12-15 17:18:07      阅读:127      评论:0      收藏:0      [点我收藏+]

标签:string   set   序列   编码表   数据   使用   nic   位置   point   

    Java字符串由char值序列组成。char数据类型是一个采用UTF-16编码表示Unicode码点的代码单元。大多数的常用Unicode字符使用一个代码单元就可以表示,而辅助字符需要一对代码单元表示。
    length方法返回采用UTF-16编码表示的给定字符串所需要的代码单元数量。例如:
        String greeting = "Hello";
        int n = greeting.length();
 
    要想得到实际的长度,即码点数量,可以调用:
        int cpCount = greeting.codePointCount(0, greeting.length());
 
    调用s.charAt(n)将返回位置n的代码单元,n介于 0 ~ s.length() - 1之间。
 
    要想得到第i个码点,应该使用下列语句
        int index = greeting.offsetByCodePoints(0,i);
        int cp = greeting.codePointAt(index);

3.6.6 码点与代码单元

标签:string   set   序列   编码表   数据   使用   nic   位置   point   

原文地址:https://www.cnblogs.com/avention/p/10123690.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!