002.Character data
01. ASCII:7 byte(0 - 127)
02. LATIN-1:8 byte (0 - 256)
03. Unicode:8 - 32 byte(0 - 4,294,967,296)
0 - 255 same as LATIN-1
Unicode只是一个数据集,并没有明确定义字节数,big - or little-endian,通常最常用的又UTF-8, UTF-16, UTF-32。
UTF-32是最幼稚的编码方式,他把所有的字符存储为32bit。
UTF-16可以表示绝大多数的字符,Java虚拟机就是用的这种编码格式。
UTF-8是最有效的编码方式,它用8bit存储ASCII字符,16bit存储其他的字母表,32bit存储东亚的字符。java的.class文件格式为UTF-8。
04.其他的编码。
....其他....
java中char类型是2byte。(0 - 65,535)。能存储绝大多数的中文字符。
浙公网安备 33010602011771号