永远不要在MySql中使用utf8

utf8 只能算一种专有字符集

我们都知道，计算机使用 0 和 1 来存储文本。比如字符“C”被存成“01000011”，那么计算机在显示这个字符时需要经过两个步骤：

计算机读取“01000011”，得到数字 67，因为 67 被编码成“01000011”。
计算机在 Unicode 字符集中查找 67，找到了“C”。
同样的：

我的电脑将“C”映射成 Unicode 字符集中的 67。
我的电脑将 67 编码成“01000011”，并发送给 Web 服务器。
几乎所有的网络应用都使用了 Unicode 字符集，因为没有理由使用其他字符集。

Unicode 字符集包含了上百万个字符。最简单的编码是 UTF-32，每个字符使用 32 位。这样做最简单，因为一直以来，计算机将 32 位视为数字，而计算机最在行的就是处理数字。但问题是，这样太浪费空间了。

UTF-8 可以节省空间，在 UTF-8 中，字符“C”只需要 8 位，一些不常用的字符，比如“”需要 32 位。其他的字符可能使用 16 位或 24 位。一篇类似本文这样的文章，如果使用 UTF-8 编码，占用的空间只有 UTF-32 的四分之一左右。

MySQL 的“utf8”字符集与其他程序不兼容，它所谓的“”，可能真的是一坨……

总结
如果你在使用 MySQL 或 MariaDB，不要用“utf8”编码，改用“utf8mb4”。
（https://mathiasbynens.be/notes/mysql-utf8mb4#utf8-to-utf8mb4 ）
提供了一个指南用于将现有数据库的字符编码从“utf8”转成“utf8mb4”。

posted @ 2020-01-03 09:20 胡布斯阅读(293) 评论(0) 收藏举报

刷新页面返回顶部

无心斗艳

永远不要在MySql中使用utf8

utf8 只能算一种专有字符集

公告