java的字符编码

编码概念:

计算机存放数据只能存放数字,所有的字符都会被转换为不同的数字。

不同的编码格式大小不一样,有些很小有些很大,有的放的了中文有的放不了中文

经常接触的是:

  ISO-8859-1 ASCII 数字和西欧字母
  GBK GB2312 BIG5 中文
  UNICODE (统一码,万国码)

 

 

 UNICODE和UTF

UNICODE:因为要存放所有的数据,那么它的棋盘是最大的。不仅如此,棋盘里每个数字都是很长的(4个字节),因为不仅要表示字母,还要表示汉字。但是完全按照UNICODE方式存储数据,会造成很大的浪费,比如在ISO-8859-1中,a 字符对应的数字是0x61而UNICODE中对应的数字是 0x00000061,在一篇英文文章中,使用UNICODE会浪费很大空间。

UTF:UTF是UNICODE的各种减肥子编码, 比如UTF-8对数字和字母就使用一个字节,而对汉字就使用3个字节,从而达到了减肥还能保证健康的效果。UTF-8,UTF-16和UTF-32 针对不同类型的数据有不同的减肥效果,一般说来UTF-8是比较常用的方式

java采用的格式:Unicode

文件的编码,比如记事本会跟随系统本身,也可以更改,另存点开编码那块就可以看到。

 

学习链接:https://how2j.cn/k/io/io-encoding/695.html#nowhere

posted @ 2020-06-09 13:14    阅读(112)  评论(0)    收藏  举报