字符(字母、数字、中文字符)统计示例

本文给出一个字符统计的例子。给定一串字符,统计其中字母、数字、中文字符、空格以及其它字符的个数。

在编写程序之前,需要考虑一下,怎样判断一个字符是一个中文字符呢?

基本的 CJK 汉字的 Unicode 码范围是 U4E00~U9FBF, 虽然是还有扩展,但是一般使用这个范围去判断一个字符是否为中文字符已经足够了。所以判断一个字符是否为中文的方法如下:

public static boolean isChineseCharacter(char c) {
    return c >= '\u4E00' && c <= '\u9FBF';
}

至于判断一个字符是否为字母或者数字,我们只需调用Character类中的isLetterisDigit方法即可。

public class CharacterStatictics {
 
    public static void main(String[] args) {
 
        int chineseCharCount = 0;
        int spaceCount = 0;
        int digitCount = 0;
        int lettersCount = 0;
        int otherChars = 0;
 
        String value = "Hello world! Welcome to Java world! 1234567890 Java 字符统计个数小程序!";
        char[] chars = value.toCharArray();
        for (char c : chars) {
            if (isChineseCharacter(c)) {
                chineseCharCount++;
            } else if (Character.isLetter(c)) {
                lettersCount++;
            } else if (Character.isDigit(c)) {
                digitCount++;
            } else if (' ' == c) {
                spaceCount++;
            } else {
                otherChars++;
            }
        }
 
        System.out.println("中文字符:" + chineseCharCount);
        System.out.println("数字:" + digitCount);
        System.out.println("字母:" + lettersCount);
        System.out.println("空格:" + spaceCount);
        System.out.println("其它字符:" + otherChars);
 
    }
 
    private static boolean isChineseCharacter(char c) {
        return c >= '\u4E00' && c <= '\u9FBF';
    }
 
}
运行结果:

中文字符:9
数字:10
字母:32
空格:8
其它字符:3

 

posted @ 2014-11-06 10:21  流星焱雨  阅读(1163)  评论(0编辑  收藏  举报