string mb_strcut ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] ) – 获取字符的一部分
1、(PHP 4 >= 4.0.6, PHP 5)
2、$str 要获取字符串的目标字符串(字符串起始位置为0)
3、$start,起始位置,以字节为单位。(一定要注意是字节)
4、$length,字节长度(一定要注意是字节)
5、$encoding,可指定字符编码(一般用于处理中文字符时使用,同时这个问题碰到的非常多)
6、特别注意:中文汉字在UTF-8编码下占3个字节,在GB2312编码下占2个字节,所以导致下面的实例中有乱码
<?php mb_internal_encoding ("UTF-8"); //如果把UTF-8改为编码,下面针对于中文字符串处理的值会改变。 echo mb_internal_encoding().""; //获取字符编码为ISO-8859-1 echo mb_strcut(‘abcdefghijk‘,0,9).""; //abcdefghi echo mb_strcut(‘abcdefghijk‘,1,5).""; //bcdef echo mb_strcut(‘我们都是中国人‘,0,9).""; //我们都是中国人 echo mb_strcut(‘我们都是中国人‘,0,9,‘gb2312‘).""; //此处有乱码了 echo mb_strcut(‘我们都是中国人‘,0,9,‘utf-8‘); //我们都是中国人 ?>
总结:
1、在处理英文字符串的时候,该函数的第四个参数($encoding)可以忽略。
2、在处理中文字符串的时候,就要小心了,一定要考虑编码问题,编码不同,中文的值也不同。
3、在中文字符串操作数据库存取时,就显得更为重要了。
4、处理字符串或文本的编码能力,是衡量程序员功力的一项标准。
与这个函数类似的mb_substr(),请直接参考。
本文出自 “金三国” 博客,谢绝转载!
原文地址:http://jinsanguo.blog.51cto.com/13363984/1970736