标签:情况 unicode编码 建议 bmp 处理 编码 bsp 汉字 字符
看unicode编码区从1 ~ 126就属于传统utf8区,当然utf8mb4也兼容这个区,126行以下就是utf8mb4扩充区
utf8mb4是utf8的超集并完全兼容utf8,能够用四个字节存储更多的字符。
标准的UTF-8字符集编码是可以使用1-4个字节去编码21位字符,这几乎包含了世界上所有能看见的语言。
MySQL里面实现的utf8最长使用3个字符,包含了大多数字符但并不是所有。例如emoji和一些不常用的汉字,这些需要四个字节才能编码的就不支持。
utf8mb4对应的排序字符集有utf8mb4_unicode_ci、utf8mb4_general_ci.
utf8mb4_unicode_ci和utf8mb4_general_ci的对比:
建议使用:utf8mb4_unicode_ci
标签:情况 unicode编码 建议 bmp 处理 编码 bsp 汉字 字符
原文地址:https://www.cnblogs.com/xingxia/p/mysql_charset.html