MySQL插入emoji表情错误的3种解决方案,Incorrect string value: '\xF0\x9F\x98\x84'

情景:将带emoji表情的数据插入到Mysql数据库

报错:Incorrect string value: '\xF0\x9F\x98\x84'

原因:mysql的UTF-8只支持三个字节的存储,而一般字符是三个字节,但是emoji表情是4个字节,所以存储不了

总结:

mysql为了解决这个问题,在5.5.3版本之后转而支持了存储4个字节的utf8字符,字符集为utf8mb4.这个相当于windowsX64和windowsX86的区别,64位是兼容32位的,也就是说utf8mb4存取utf8都是没有问题的

解决方案1

在有表情的字段上就应该这样做,将该字段设置为utf8mb4

 ALTER TABLE table_name MODIFY  colum_name  VARCHAR(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci

设置下表的字符集

 ALTER TABLE table_name CHARSET=utf8mb4;

设置本数据库为utf8mb4啊

 SET NAMES utf8mb4

可是在服务器和数据库连接的地方怎么办?

jdbc.url=jdbc:mysql://localhost:3306/aaa?useUnicode=true&characterEncoding=utf-8

这里这个utf-8要改成utf8mb4吗?

貌似不能改啊,数据库驱动就这些编码,没法改啊,一改就出错,不过没事,这是可以兼容的,对于jdbc的驱动来说.

那么接下来会出现两个现象,

第一:你可以存储表情了。

第二:由于未知原因,你还是不能存储表情。

对于第二种情况的同学,我要告诉你的是,当你去操作这些需要加入表情的字段之前,请插入这条sql语句。

 SET NAMES utf8mb4

即可。

也就是说每次插入啊修改啊之前都set一次就没有问题了。

 

解决方案2

将表情进行移除,使用以下方法

String string = EmojiParser.removeAllEmojis(param);

需要引包

<!-- https://mvnrepository.com/artifact/com.vdurmont/emoji-java -->
<dependency>
    <groupId>com.vdurmont</groupId>
    <artifactId>emoji-java</artifactId>
    <version>4.0.0</version>
</dependency>

 

解决方案3

修改保存类型,字符串是万金油,但是字节数组是万金油之王.我们可以对这种字段不存储varchar类型,而是存储varbinary,

确实能存进去,但是中文会变成乱码。

需要测试方案1和方案3。

posted @ 2022-02-14 12:15  背着泰山找黄河  阅读(718)  评论(0编辑  收藏  举报