VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > temp > python入门教程 >
  • 数据中有emoji,导致插入不了数据库

前言

前两天负责的系统,因为需要获取用户的昵称并进行入库,但是有个别用户的昵称中存在emoji表情,导致入库时报错。

报错内容:
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94‘ for column


问题原因

Q:为什么我们设置表的的字符类型为utf8却不能存放emoji呢?

A:因为我们UTF-8编码可能是2或3或4个字节,但mysql中的utf8是3个字节,存放一个emoji是需要4个字节的,自然不够。

Mysql数据库在5.5.3之后开始支持utf8mb4字符集,所以mysql版本是5.5.3+的都可以设置让数据库存储Emoji表情

所以如果你的应用有移动端的,最好一开始设计数据库的时候就使用utf8mb4字符集
 

解决方案:

方案一: 过滤字符串中的emoji

方案二: 转译emoji后入库。获取时反转译成emoji使用

//转译emoji
URLEncoder.encode(含有emoji的数据, "UTF-8");
//反转译成emoji<br/>
URLDecoder.decode(经过转义的数据, "UTF-8");

另外再推荐一款emoji转义工具

注意点:emoji转译后可以入库。但当用户就是输入的内容本身就是【转译后的内容】

此时从库中反转译时就变成了emoji。这就造成跟用户输入不一致的情况

方案三: 修改数据库配置,实现可存储emoji

目前网上给的解决方案普遍都是:修改该字段或者该张表的编码方式为utf8mb4

但仅这么处理是并不起作用。

还需要执行SET NAMES utf8mb4; 将整个库的 character_set_client、character_set_connection、character_set_results等值修改为utf8mb4才会起作用

修改已经建立表的字符集alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;

注意点:新建数据库时可以进行初始化设置,但是已有的线上生产库进行此操作有风险,因此建议使用相关类库转义后进行存储和显示

使用下列SQL语句可以查看MySQL中character_set相关变量:
SHOW VARIABLES LIKE '%char%';


原文:https://www.cnblogs.com/mlwy/p/15582776.html
 

相关教程