码迷,mamicode.com
首页 > 数据库 > 详细

mysql5.1中utf8编码下一个汉字占用一个char的疑惑

时间:2015-01-27 11:17:46      阅读:228      评论:0      收藏:0      [点我收藏+]

标签:

最近发现Oracle和MySQL的字段长度的计算不一样(都是UTF8编码),比如:
在Oracle下定义:name varchar2(10) ,name字段能存放:10个字符或3个汉字
在MySQL下定义:name varchar(10),name字段能存放:10个字符或10个汉字
从上面可以得知:在oracle下,1个汉字=3个字节
为什么在 MySQL 下,1个汉字=1个字节 呢??

经查,说:MySQL5 以后 varchar 的单位是字符了,而 oracle 的varchar2 是字节 
编码不一样一个汉字占用的字节也不一样:
UTF-8 下 1汉字=3字节
GDK下 1汉字=2字节

mysql varchar(50),不管中文还是英文都是存50个的。
MySQL5的文档,其中对varchar字段类型这样描述:varchar(m) 变长字符串。M 表示最大列长度。M的范围是0到65,535。(VARCHAR的最大实际长度由最长的行的大小和使用的字符集确定,最大有效长度是65,532字节)。
为何会这般变换?真是感觉MySQL的手册做的太不友好了,因为你要仔细的继续往下读才会发现这段描述:MySQL 5.1遵从标准SQL规范,并且不删除VARCHAR值的尾部空格。VARCHAR保存时用一个字节或两个字节长的前缀+数据。如果VARCHAR列声明的长度大于255,长度前缀是两个字节。
好了,貌似懂了一点。但具体他说的长度大于255时使用2个字节长度前缀,小学减法题:65535 - 2 = 65533啊。不知道这些大牛如何计算的,暂且保留疑问吧?

注:我测试了一下使用UTF8编码,varchar的最大长度为21854字节。
在mysql 5.0.45版本,数据库编码utf8下进行测试:varchar最长定义为21785。也就是说不论字母、数字、汉字,只能放21785个。

推想:varchar字节最大65535,utf8编码一个字符3个字节65535/3=21785。但是用length函数取值的时候发现,一个汉字占3个字节,一个字母等字符占用一个字节。这个对于char(10)来说,是不是实际长度是不定的呢?

参考链接:
http://www.oschina.net/question/59889_12699
http://zhidao.baidu.com/question/132054814

mysql5.1中utf8编码下一个汉字占用一个char的疑惑

标签:

原文地址:http://blog.csdn.net/cblou/article/details/43191337

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!