码迷,mamicode.com
首页 > 数据库 > 详细

MySQL 中如何存储 emoji ?

时间:2016-08-22 16:22:35      阅读:183      评论:0      收藏:0      [点我收藏+]

标签:数据库   兄弟连   

 

问题还原

 

使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:

 

<<240,159,152,134,240,159,152,144>>

查看二进制的 unicode 是什么?

 

14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).

[128518,128528]

15> erlang:integer_to_list(128518,16).%%查看十六进制

"1F606"

16> erlang:integer_to_list(128528,16).

"1F610"

明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。

 

1F606 和 1F610 代表什么?

 

根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。

 

MySQL 上存储失败的原因

 

目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 个字节,而 emoji 的 unicode 已经超过了 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji

 

为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji

 

另外 utf8mb4 向下兼容 utf8

 

解决方案

 

将 MySQL 中对应的字段改成 utf8mb4 编码:

 

ALTER TABLE t1

  DEFAULT CHARACTER SET utf8mb4,

  MODIFY col1 CHAR(10)

    CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL,

  MODIFY col2 CHAR(10)

    CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;

 

将连接库的连接编码改为 utf8mb4下面兄弟连(www.lampbrother.net)就以 erlang 的连接库 emysql 为例:

 

emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]).

%%或者

emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4).

为了建表方便,可以修改 my.cnf

 

服务器字符集

[mysql]

default-character-set=utf8mb4

[mysqld]

character-set-server=utf8mb4


MySQL 中如何存储 emoji ?

标签:数据库   兄弟连   

原文地址:http://11923030.blog.51cto.com/11913030/1841086

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!