字符编码

ASCII码

标准ASCII码

标准ASCII码占1个字节,使用其中的低7位,最高位用作奇偶校验。

扩展ASCII码

 

GBK码

 

ISO码

 

Unicode码

UTF-8占1~4个字节,UTF-16占2、4个字节,UTF-32占4个字节。

UTF-8

1、UTF-8编码预先定义了一套编码与字符对应的集,每个字符的编码具有唯一性。

2、识别连续的UTF编码字节如何表示字符,先判断第一个字节,如果是以0开头,则这个字符是用一个字节表示。如果是1开头,连续n个1表示这个字符占n个字节,第一个字节以连续n个1和1个0开头,后续n-1个字节以10开头。

UTF-8字节流(二进制)
0xxxxxxx
110xxxxx 10xxxxxx
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

3、ASCII码是UTF-8的子集。

 

posted @ 2019-10-23 11:43  蓝色风扇  阅读(195)  评论(0编辑  收藏  举报