MySQL的数据类型

Mysql版本众多,每个版本支持的数据类型繁多且不一样,本篇文章中主要基于MySQL Community Server 5.7.22介绍常用的数据类型,包括其特点以及区别。

MySQL数据类型

正确的定义表结构:数据类型、字段长度,对于数据库性能至关重要。

MySQL的数据类型大致可分三类:

  • 数值类型
  • 字符串(字符)类型
  • 日期和时间类型

数值类型

MySQL支持所有标准SQL数值数据类型。

这些类型包括严格数值数据类型(INTEGER、SMALLINT、DECIMAL和NUMERIC),以及近似数值数据类型(FLOAT、REAL和DOUBLE PRECISION)。

关键字INT是INTEGER的同义词,关键字DEC是DECIMAL的同义词。

BIT数据类型保存位字段值,并且支持MyISAM、MEMORY、InnoDB和BDB表。

作为SQL标准的扩展,MySQL也支持整数类型TINYINT、MEDIUMINT和BIGINT。下面的表显示了需要的每个整数类型的存储和范围。

类型 大小 范围(有符号) 范围(无符号) 用途
TINYINT 1 字节 (-128,127) (0,255) 小整数值
SMALLINT 2 字节 (-32 768,32 767) (0,65 535) 大整数值
MEDIUMINT 3 字节 (-8 388 608,8 388 607) (0,16 777 215) 大整数值
INT或INTEGER 4 字节 (-2 147 483 648,2 147 483 647) (0,4 294 967 295) 大整数值
BIGINT 8 字节 (-9,223,372,036,854,775,808,9 223 372 036 854 775 807) (0,18 446 744 073 709 551 615) 极大整数值
FLOAT 4 字节 (-3.402 823 466 E+38,-1.175 494 351 E-38),0,(1.175 494 351 E-38,3.402 823 466 351 E+38) 0,(1.175 494 351 E-38,3.402 823 466 E+38) 单精度 浮点数值
DOUBLE 8 字节 (-1.797 693 134 862 315 7 E+308,-2.225 073 858 507 201 4 E-308),0,(2.225 073 858 507 201 4 E-308,1.797 693 134 862 315 7 E+308) 0,(2.225 073 858 507 201 4 E-308,1.797 693 134 862 315 7 E+308) 双精度 浮点数值
DECIMAL 对DECIMAL(M,D) ,如果M>D,为M+2否则为D+2 依赖于M和D的值 依赖于M和D的值 小数值

根据上表,对于表结构的列字段数据类型选型一定要精确匹配,能够节省存储空间,体现设计的严谨。比如订单状态,可以使用TINYINT类型。

DECIMAL-Fixed-Point Types (Exact Value):当需要明确表示数值精度时,就需要使用DECIMAL,比如货币数据,金钱是无法四舍五入近似处理的数据。比如薪资,存款。

FlOAT/DOUBLE-Floating-Point Types (Approximate Value):浮点类型大多数用于近似处理场景。

Type Storage(Bytes) Precision
FLOAT 4 23
DOUBLE 8 53

字符串类型

类型 大小 用途
CHAR 0-255字节 定长字符串
VARCHAR 0-65535 字节 变长字符串
TINYBLOB 0-255字节 不超过 255 个字符的二进制字符串
TINYTEXT 0-255字节 短文本字符串
BLOB 0-65 535字节 二进制形式的长文本数据
TEXT 0-65 535字节 长文本数据
MEDIUMBLOB 0-16 777 215字节 二进制形式的中等长度文本数据
MEDIUMTEXT 0-16 777 215字节 中等长度文本数据
LONGBLOB 0-4 294 967 295字节 二进制形式的极大文本数据
LONGTEXT 0-4 294 967 295字节 极大文本数据
ENUM 枚举类型,只允许插入枚举的数据或者空值
JSON 可以直接存储JSON类型数据,并能基于key值查找
CHAR与VARCHAR

CHAR和VARCHAR类型十分相似,都是存储字符。但是从底层检索和存储角度分析,表现又不一样,且最大长度和尾部遗留空间是否保留的策略上表现也不尽相同,下面列出他们的相同点和不同点:

  • 相同点
    • 都是存储字符类型数据
    • 类型申明时,都指定长度
  • 不同点
    • 表示的长度范围不一。CHAR能表示0-255长度的字符, VARCHAR可以表示0-65535长度
    • CHAR申明后,存储数据时长度是固定的,长度不足时从右边补空格。VARCHAR申明后,存储时长度是可变的, VARCHAR最大有效长度取决于行数据的大小和字符集, VARCHAR在存储时有额外的1-2byte用来表示存储的数据的字节个数
    • CAHR在检索时,将去除后面的空格

在非严格模式下,对于超过列申明长度的CHAR或者VARCHAR,mysql会截取以适合其申明的长度进行存储。

关于 varchar,有的说最大长度是 255,也有的说是 65535,查阅很多资料后发现是这样的:varchar 类型在 5.0.3 以下的版本中的最大长度限制为 255,而在 5.0.3 及以上的版本中,varchar 数据类型的长度支持到了 65535,也就是说可以存放 65532 个字节(注意是字节而不是字符!)的数据(起始位和结束位占去了3个字节),也就是说,在 5.0.3 以下版本中需要使用固定的 TEXT 或 BLOB 格式存放的数据可以在高版本中使用可变长的 varchar 来存放,这样就能有效的减少数据库文件的大小。

BINARY 和 VARBINARY

BINARY 和 VARBINARY 类似于 CHAR 和 VARCHAR,不同的是它们包含二进制字符串而不要非二进制字符串。也就是说,它们包含字节字符串而不是字符字符串。这说明它们没有字符集,并且排序和比较基于列值字节的数值值。

BLOG 和 TEXT

BLOB 是一个二进制大对象,存储String的二进制,比如图片二进制字节。有 4 种 BLOB 类型:TINYBLOB、BLOB、MEDIUMBLOB 和 LONGBLOB。它们区别在于可容纳存储范围不同。

TEXT存储文本,text 不可以有默认值,其最大长度是 2 的 16 次方-1。有 4 种 TEXT 类型:TINYTEXT、TEXT、MEDIUMTEXT 和 LONGTEXT。对应的这 4 种 BLOB 类型,可存储的最大长度不同,可根据实际情况选择。

JSON

在MySQL5.7.8之后开始支持一种可高效获取JSON文本中数据的原生JSON类型,该类型具有以下优点:

  • JSON数据有效性检查:BLOB类型无法在数据库层做这样的约束性检查
  • 查询性能的提升:查询不需要遍历所有字符串才能找到数据
  • 支持索引:通过虚拟列的功能可以对JSON中的部分数据进行索引

另外,系统对JSON格式做了一些限制:

  • JSON文本的最大长度取决有系统常量:max_allowed_packet。该值仅在服务器进行存储的时候进行限制,在内存中进行计算的时候是允许超过该值的。
  • JSON列不可有默认值
  • JSON列与其他二进制类型列一样是无法创建索引。但是可以从JSON列中所存储的文本中某些表列值进行创建索引。MySQL最优控制器同样在通过JSON表达创建的索引中进行查询。
ENUM 枚举类型

枚举在常量列表数据中可能会使用,主要是为了提高性能。

mysql> alter table test add address enum("beijing","shanghai");
Query OK, 0 rows affected (0.02 sec)

上面想test表中加入一个字段address,并且提供两个枚举值,如果新插入的数据不在枚举的值范围内,则会插入失败,当然,上面的写法默认允许null值,所以,插入null值也可以,下面限定了不为空,所以,只能插入枚举值

mysql> alter table test add address enum("beijing","shanghai") not null;
Query OK, 0 rows affected (0.02 sec)

CHAR 、VARCHAR、TEXT 应用场景总结

  • 经常变化的字段用 VARCHAR
  • 知道固定长度的用 CHAR
  • 超过 255 字符的只能用 VARCHAR 或者 TEXT
  • 能用 VARCHAR 的地方不用 TEXT
  • 尽量用 VARCHAR

日期和时间类型

每个时间类型有一个有效值范围和一个"零"值,当指定不合法的即MySQL不能表示的值时使用"零"值。

类型 大小 (字节) 范围 格式 用途
DATE 3 1000-01-01/9999-12-31 YYYY-MM-DD 日期值
TIME 3 '-838:59:59'/'838:59:59' HH:MM:SS 时间值或持续时间
YEAR 1 1901/2155 YYYY 年份值
DATETIME 8 1000-01-01 00:00:00/9999-12-31 23:59:59 YYYY-MM-DD HH:MM:SS 混合日期和时间值
TIMESTAMP 4 1970-01-01 00:00:00/2038结束时间是第 2147483647 秒,北京时间 2038-1-19 11:14:07,格林尼治时间 2038年1月19日 凌晨 03:14:07 YYYYMMDD HHMMSS 混合日期和时间值,时间戳
  • DATE表示日期,无时间部分。mysql检索和展示日期使用'YYYY-MM-DD'格式,范围在:'1000-01-01' to '9999-12-31'。
  • DATETIME表示日期时间,既有日期部分又有时间部分。mysql检索和展示日期时间使用'YYYY-MM-DD HH:MM:SS'格式,范围在:'1000-01-01 00:00:00' to '9999-12-31 23:59:59'。
  • TIMESTAMP表示时间戳,既有日期也有时间部分。范围在:1970-01-01 00:00:01' UTC to '2038-01-19 03:14:07' UTC。由此可以看出DATETIME和TIMESTAMP的区别在于时间表示的范围上。除此,mysql在存储TIMESTAMP类型时将TIMESTAMP值从当前时区转换到UTC时区,检索时再将其从UTC转换到当前时区。这个时区设置是基于数据库连接的。默认情况下,每个连接的时区被设置为server端的时区,也可以单独设置连接的时区。所以如果改变连接的时区,检索时获取到的TIMESTAMP将表现不同。
  • TIME表示时间。mysql检索和展示时使用'HH:MM:SS'格式或者HHH:MM:SS,范围在:'-838:59:59' to '838:59:59'。TIME类型不仅可以表示一天中的时间点,还可以表示过去的时间或者间隔的时间段,所以可以是三位H。

字节长度与编码

MySQL 5.0 以上的版本:

1、一个汉字占多少长度与编码有关:

UTF-8:一个汉字=3个字节

GBK:一个汉字=2个字节

2、varchar(n) 表示 n 个字符,无论汉字和英文,Mysql 都能存入 n 个字符,仅是实际字节长度有所区别

3、MySQL 检查长度,可用 SQL 语言来查看:

select LENGTH(fieldname) from tablename
posted @ 2020-03-05 07:55  Youpeng  阅读(501)  评论(0编辑  收藏  举报