在爬虫向Mysql插入数据的时候发现会报错“”Incorrect String Value:‘\xf0\x9f“”,这个问题是因为UTF-8有可能是两个,三个,四个字节,Emoji表情或者某些特殊字符是4个字节,所以从网页上爬取的内容可能包含表情,而Mysql的utf8编码最多3个字节,所以数据插不进去。解决方案如下:
在/etc下找到my.cnf,修改如下:
[mysqld]
character-set-server=utf8mb4
[mysql]
default-character-set=utf8mb4
修改后重启Mysql
将已经建好的table也转换成utfmb4:
更改数据库编码:ALTER DATABASE caitu99 CHARACTER SET utf8mb4
COLLATE utf8mb4_general_ci
;
alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;