论用Unicode,UTF-8读取与储存

Unicode将世界上各种各样的语言统一在一起,避免了乱码的问题。但对于一些只需1个字节的字符来说,太浪费储存空间了。

而UTF-8作为可变长度编码,可根据符号改变字节,提高了储存空间的利用率。所以在储存文本的时候电脑经常会将uincode编码转化为UTF-8再进行存储。

 

那为什么不直接用UTF-8进行读取与储存呢?

因UTF-8是可变长度编码,在处理数据的时候不从头扫一遍根本不知道位置在哪,非常浪费时间。

uincode编码是定长编码,处理数据的时间比UTF-8少得多。

所以人们习惯性用Unicode编码读取数据,用UTF-8储存数据。

 

posted @ 2020-03-24 21:40  时条让  阅读(193)  评论(0)    收藏  举报