蜗牛大师

吴庆龙的学习笔记

导航

Java中的char占用几个字节

一、概述

网上或书上都说是 Java 中的 char 占用 2 个字节,一直没有深入,直到接触了编码,才对此产生了疑问,今天来深入一下这个问题。

二、答疑

char 在设计之初的时候被用来存储字符,可是世界上那么多字符,如果有 1 个字节,就意味着只能存储 256(2^8)个字符,显然不合适,而如果用两个字节呢,那么就可以存储 65536(2^16)个字符,这个数量符合大多数国家的语言字符个数于是 Java 团队使用 unicode 作为编码,一个 char 作为 2 个字节来存储。

但是 unicode 只是一个标准,具体的实现还是有如:UTF-8 或 UTF-16 等编码。

Java 的默认编码是 UTF-8,可以通过Charset.defaultCharset();System.getProperty("file.encoding")来获取,也可以在运行时指定 VM 参数 -Dfile.encoding=UTF-16来改变默认字符集。

1、Java 中的 char 一定是 2 个字节吗?

不一定,与我们使用的字符集有关系,如果使用 ASCII 编码集,那么 char 占用一个字节,如果使用 UTF-8 编码格式呢?UTF-8 是不定长编码,编码的长度是动态的,所以不一定。

2、Java 中的 char 能存储中文吗?

这个问题依旧归结于使用的编码集,如果使用ASCII,那肯定不能存储,如果采用UTF-8,那可以。

三、总结

char 的长度和是否能存储中文字符是和编码格式有关的。对于我们在编码的时候如果跨平台编码时,应该在编码、解码的时候设置对应的格式,防止由于编解码导致的异常。

posted on 2019-01-28 11:09  蜗牛大师  阅读(16697)  评论(0编辑  收藏  举报