中文字符编码

时间：2020-04-22 20:04:47 阅读：93 评论：0 收藏：0 [点我收藏+]

标签：字符 coding src UNC div img 存储 range cte

Unicode是支持最广的，这就意味着我们可以作为一个中间体来转换。多种字符集都是可互相转的，很简单。

技术图片

https://tonybai.com/2019/11/07/non-ascii-character-encoding-illustrated/

func main() {
    var s = "中国人"
    // rune == 码点 == Unicode中的序号 == Unicode字符
    // 中 => 码点：4E2D
    // 国 => 码点：56FD
    // 人 => 码点：4EBA
    // 结合图一目了然
    for _, v := range s {
        fmt.Printf("%s ===> 码点 : %X\n", string(v), v)
    }

    println()

    // 汉字是以UTF-8编码存储的
    // 直接可以转换看到字节
    // E4B8AD ===> 可以看到是3个字节，符合UTF-8对于汉字的编码规则
    for _, v := range []byte(s) {
        fmt.Printf("%X", v)
    }
}

对于转换等，开源的很多。

中文字符编码

标签：字符 coding src UNC div img 存储 range cte

原文地址：https://www.cnblogs.com/CherryTab/p/12755271.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行