[转]Java中的字符串操作(比较String,StringBuiler和StringBuffer)

本文作者:@Yuchao Huang

原文链接:https://cnblogs.com/misterchaos/p/12782986.html

版权声明:自由转载-非商用-知识共享署名4.0

一、前言

刚开始学习Java时,作为只会C语言的小白,就为其中的字符串操作而感到震撼。相比之下,C语言在字节数组中保存一个结尾的\0去表示字符串,想实现字符串拼接,还需要调用strcpy库函数或者自己手动去复制数组,非常麻烦,更别提其他复杂操作,而Java通过String类让字符串操作变得十分简单和方便。除此之外,还有stringbuilder等这些类的辅助,那么本文就从String,StringBuiler和StringBuffer的区别开始,去探讨Java中的字符串操作。

二、String,StringBuiler和StringBuffer

2.1 String类

Java 提供了 String 类来创建和操作字符串。在源码中可以看到,String类内部的实现也是一个字节数组,这个数组是final类型的,因此String是不可变的对象,每次在对String类进行改变的时候都会生成一个新的string对象,然后将指针指向新的string对象。

2.2 StringBuiler 类

和 String 类不同的是,StringBuilder 类的对象能够被多次的修改,并且不产生新的对象。这个特性的意义在于,如果我们进行大量的字符串操作,使用String类就会产生很大的性能消耗,而StringBuilder就可以避免这个问题。

2.3 StringBuffer 类

StringBuffer 和StringBuiler之间的最大不同在于 StringBuilder 的方法不是线程安全的

由于 StringBuilder 相较于 StringBuffer 有速度优势,所以多数情况下建议使用 StringBuilder 类。然而在应用程序要求线程安全的情况下,则必须使用 StringBuffer 类。

2.4 String,StringBuiler和StringBuffer的比较(对比C/C++)

操作类型 说明 是否可变 线程安全性 性能
Java中的String String 类中使用 final 关键字修饰字符数组来保存字符串 不可变 线程安全
Java中的StringBuffer 字符串变量 可变 线程安全 一般
Java中的StringBuilder 字符串变量 可变 线程不安全 一般
C/C++ 中的char* 操作 char *是一个指针,可以 指向一个字符串数组 可变 不可知
C/C++中的char数组 用一个字符数组来保存字符串 不可变 不可知
C/C++中的String封装类 string可以被看成是以字符 为元素的一种容器。 可变 并发读操作 是线程安全的 较高

三、各种字符串操作的效率测试

3.1 测试代码

    @Test
    public void test() {
        int count = 100000;

        long startTime = System.currentTimeMillis();
        String str = "";
        for(int i = 0; i< count; i++){
            str += i;
        }
        System.out.println("执行"+count+"次  String 耗时:"+ getRunTime(startTime));

        startTime = System.currentTimeMillis();
        StringBuilder stringBuilder = new StringBuilder("");
        for (int i = 0; i < count; i++) {
            stringBuilder.append(i);
        }
        System.out.println("执行"+count+"次  StringBuilder 耗时:"+ getRunTime(startTime));

        startTime = System.currentTimeMillis();
        StringBuffer stringBuffer = new StringBuffer("");
        for (int i = 0; i < count; i++) {
            stringBuffer.append(i);
        }
        System.out.println("执行"+count+"次  StringBuffer 耗时:"+ getRunTime(startTime));

    }

3.2 测试结果

执行100000次  String 耗时:32s
执行100000次  StringBuilder 耗时:2ms
执行100000次  StringBuffer 耗时:4ms

3.3 小结

可以看到String类的性能远低于StringBuiler和StringBuffer,而StringBuiler在本次测试中比Stringbuffer提高了50%的性能

四、Java字符串和正则表达式

4.1 测试代码

    @Test
    public void test0(){
        //邮政编码
        String postCode = "[1-9]\\d{5}";
        //区号-座机号码
        String areaCode = "\\d{3}-\\d{8}|\\d{4}-\\d{7}";
        //手机号码
        String phone = "(?:13\\d|15\\d|18\\d)\\d{5}(\\d{3}|\\*{3})";

        String text = "邮政编码:440834"+
                      "区号-座机号码: 020-12345678"+
                      "手机号:13536373839"+
                      "邮政编码:440833"+
                      "区号-座机号码: 010-12345678"+
                      "手机号:13536373739";

        Pattern p = Pattern.compile(postCode);
        Matcher m = p.matcher(text);
        System.out.println("文本中包含邮政编码:");
        while (m.find()){
            System.out.println(m.group());
        }

        p = Pattern.compile(areaCode);
        m= p.matcher(text);
        System.out.println("文本中包含区号-座机号码:");
        while (m.find()){
            System.out.println(m.group());
        }

        p = Pattern.compile(phone);
        m= p.matcher(text);
        System.out.println("文本中包含手机号:");
        while (m.find()){
            System.out.println(m.group());
        }
    }

4.2 测试结果

文本中包含邮政编码:
440834
123456
135363
440833
123456
135363
文本中包含区号-座机号码:
020-12345678
010-12345678
文本中包含手机号:
13536373839
13536373739

五、总结

经过测试和比较,可以看到Java中同为字符串操作,但由于背后实现的原理不同,形成的性能差异也是十分巨大,相比之下,C/C++中的字符串操作性能更高。String类的性能远低于StringBuiler和StringBuffer,而StringBuiler比Stringbuffer的性能稍微高一点。对性能的探究,最终还是要回到使用场景,可以总结得出,如果不涉及字符串操作,那么String类是首选,如果涉及的字符串操作没有线程安全问题,那么使用StringBuilder,如果涉及的字符串操作存在线程安全问题,那么使用StringBuffer

六、参考资料

posted @ 2021-02-20 11:07  MelodyJerry  阅读(71)  评论(0编辑  收藏  举报
没有伞的孩子必须努力奔跑!|
载入天数...载入时分秒...
(っ•̀ω•́)っ✎⁾⁾ 开心每一天