码迷,mamicode.com
首页 > 微信 > 详细

mysql 微信用户昵称emoji 完整保存

时间:2017-07-22 13:16:26      阅读:447      评论:0      收藏:0      [点我收藏+]

标签:编码格式   byte   ...   技术分享   ret   lex   chat   arch   名称   

微信用户昵称现在丰富多样,一些个性的名称中经常包含有特殊字符,以及emoji表情。起先,我总以为MySQL只能保存纯文本数据。但其实mysql(5.7版本)已非常强大,完整保存微信用户昵称(emoji表情)已不在话下。

起先,我的项目是无法保存这些含有emoji表情的昵称。为了鲜明的对比前后我做出的调整,先来看看之前的状况。

1.mysql表字段定义

`third_name` varchar(255) CHARACTER SET utf8 DEFAULT NULL COMMENT ‘用户第三方账号昵称‘,

 

 

字段类型为utf8

2.mysql数据库连接字符串

<!-- Connection Info -->
<property name="url" value="${url}?useUnicode=true&amp;characterEncoding=utf8&amp;" />

 

jdbc连接使用的编码格式也为utf8

3.微信昵称

技术分享

这昵称中有emoji表情的小眼睛在瞅着我。

4.保存出错

Caused by: java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x91\x80\xE5\xBC...‘ for column ‘third_name‘ at row 1
    at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1073)
    at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3609)

 

 

接下来,我们看一下可以保存后的调整。

①、mysql表字段定义为utf8mb4

`third_name` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL COMMENT ‘用户第三方账号昵称‘,

 

 

注意改成了“utf8mb4”,不再是utf8,主要是支持的字节数不同。

MySQL在5.5.3版本之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。其实,utf8mb4是utf8的超集,理论上原来使用utf8,然后将字符集修改为utf8mb4,也会不会对已有的utf8编码读取产生任何问题。当然,为了节省空间,一般情况下使用utf8也就够了。 
想要了解的更多,请参照浅谈MySQL中utf8和utf8mb4的区别

②.mysql数据库连接字符串去掉编码方式,假如不行,那就把编码改成utf8mb4也可以的

<!-- Connection Info -->
<property name="url" value="${url}" />

 

 

③.保存后效果

使用Navicat查看的效果如下:

技术分享

网页上效果如下,小眼睛可以正常显示:

技术分享

mysql 微信用户昵称emoji 完整保存

标签:编码格式   byte   ...   技术分享   ret   lex   chat   arch   名称   

原文地址:http://www.cnblogs.com/tdalcn/p/7220802.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!