php过滤表单输入的meoji表情

时间：2017-04-13 23:36:47 阅读：363 评论：0 收藏：0 [点我收藏+]

1.过滤emoji表情的原因

　　在我们的项目开发中，emoji表情是个麻烦的东西，即使我们可以能存储，也不一定能完美显示，因为它的更新速度很快：在iOS以外的平台上，例如PC或者android。如果你需要显示emoji，就得准备一大堆emoji图片并使用第三方前端类库才行。即便如此，还是可能因为emoji图片不够全而出现无法显示的情况
在大多数业务场景下，emoji也不是非要不可的。我们可以适当地考虑干掉它，节约各种成本。

2.php过滤emoji原理

　　Emoji （絵文字，词义来自日语えもじ，e-moji，moji在日语中的含义是字符）是一套起源于日本的12x12像素表情符号，由栗田穣崇(Shigetaka Kurit)创作，最早在日本网络及手机用户中流行。自苹果公司发布的iOS 5输入法中加入了emoji后，这种表情符号开始席卷全球，目前emoji已被大多数现代计算机系统所兼容的Unicode编码采纳，普遍应用于各种手机短信和社交网络中。近期，更是有不少网友用emoji图案玩猜字游戏，享受这种表情文化带来的乐趣。

关于emoji的发音：很多人第一眼见到emoji便会下意识将其误读作“一磨叽”，其实不然，emoji音译过来大概读作“诶磨叽”，当中“e”的发音颇似字母abc的a的发音。

最初日本的三大电信运营商各自有不同的字符定义，分别是DoCoMo、KDDI和Softbank。随着iOS内置了Softbank的版本，emoji在全球范围内风靡（iOS5版本以前）。而Google又自己定义了一套emoji字符。iOS5以后，apple采用了unicode定义的emoji字符（iOS5版本以后）。

unicode定义的emoji是四个字符，softbank为3个字符，emoji的四个字符从存储到展示对应没有做过考虑的系统来说，简直就是灾难。

3.针对unicode定义的emoji表情过滤

　　①.unicode定义的emoji是四个字符，根据这个原理进行过滤

// 过滤掉emoji表情
function filter_Emoji($str)
{
    $str = preg_replace_callback(    //执行一个正则表达式搜索并且使用一个回调进行替换
            ‘/./u‘,
            function (array $match) {
                return strlen($match[0]) >= 4 ? ‘‘ : $match[0];
            },
            $str);

     return $str;
 }

　　②. unicode emoji是4个字节，softbank定义的emoji占用3个字节存储，通过emoji for php ，我们可以把unicode的emoji方式转换为softbank方式，从而实现不修改数据库，就能存储emoji，相对于数据库层面的解决问题的方式，动作要小的多，并且也不会有性能，运维等方面的问题。但是有个不可避免的问题是，Softbank方式已经不再维护，所以新增加的emoji表情，Softbank中都没有，会造成部分emoji表情丢失的情况，对于这种情况不推荐使用。

　　后续还有一些方法没有亲自实践过，但是给大家提供出来。

　　1、使用utf8mb4字符集

　　如果你的mysql版本>=5.5.3，你可以尝试直接将utf8直接升级为utf8mb4字符集
　　这种4字节的utf8编码可完美兼容旧的3字节utf8字符集，并且可以直接存储emoji表情，是较好的解决方案之一。
　　至于字节增大带来的性能损耗，根据自己的项目，自己估算吧....

　　2、使用base64编码

　　如果你因为某些原因无法使用utf8mb4字符集的话，你还可以使用base64来曲线救国
　　使用例如base64_encode之类的函数编码过后的emoji可以直接存储在utf8字节集的数据表中，取出时decode一下即可

php过滤表单输入的meoji表情

标签：apple 场景不同的 unicode编码搜索发音好的 sof 日本

原文地址：http://www.cnblogs.com/jingmin/p/6706704.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行