> 文章列表 > 深入底层谈谈String

深入底层谈谈String

深入底层谈谈String

深入底层谈谈String

  • 一、聊聊字符串拼接【底层】
  • 二、聊聊String实现(源码分析)
    • 实现的接口
    • 内部属性及其部分构造函数
    • 部分方法说明
      • 明明replace,replaceAll,substring等方法得到了新的字符串,为什么说String是不变的呢?
  • 三、总结

一、聊聊字符串拼接【底层】

给一个测试 Demo1:

public class Demo1 {public static void main(String[] args) {String a = "a";String b = "b";String c = "ab";String d = a+b;}
}

利用 javap -v Demo1.class 命令看看编译后字节码中的main方法(
-v 命令参数,含附加信息)

public static void main(java.lang.String[]);descriptor: ([Ljava/lang/String;)Vflags: (0x0009) ACC_PUBLIC, ACC_STATICCode:stack=2, locals=5, args_size=10: ldc           #2                  // String a2: astore_1    放到下面局部变量表中,1表示的是位置,对应Slot列名3: ldc           #3                  // String b5: astore_26: ldc           #4                  // String ab8: astore_39: new           #5      这里准备实例化了一个StringBuilder对象            // class java/lang/StringBuilder12: dup13: invokespecial #6       通过无参构造的方式           // Method java/lang/StringBuilder."<init>":()V16: aload_1		从表中取变量,取Slot为1的17: invokevirtual #7    这里对拿到的变量进行字符串凭借             // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;20: aload_221: invokevirtual #7       这里也对拿到的变量进行字符串凭借           // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;24: invokevirtual #8 这里通过调用StringBuilder中的toString方法得到一个新的String对象            // Method java/lang/StringBuilder.toString:()Ljava/lang/String;27: astore        4     把那得到的新String对象赋给局部变量表中Slot为4的29: return   方法结束// 这是main方法中的局部变量表  LocalVariableTable:Start  Length  Slot  Name   Signature0      30     0  args   [Ljava/lang/String;3      27     1     a   Ljava/lang/String;6      24     2     b   Ljava/lang/String;9      21     3     c   Ljava/lang/String;29       1     4     d   Ljava/lang/String;

通过分析上面(含附加信息)的main方法的字节码可以得出,字符串对象通过+进行拼接的细节部分。首先会去创建一个空的StringBuilder对象,然后把从局部变量表中取出相应的字符串调用append方法进行拼接,最后通过toString方法得出结果也就是说每次使用+去拼接字符串都会创建一个新的StringBuilder对象去进行操作。所以如果是什么什么集合字符串然后进行拼接,还是别乱用加号进行拼接。

StringBuilder中的toString方法@Overridepublic String toString() {// Create a copy, don't share the arrayreturn new String(value, 0, count);}

可以看见是重新 new 了一个 String 对象,也就是 d 变量是指向一个新的String 对象,放入堆中。 但是上面的 c 变量是通过直接字符串赋值的方式,这种方式是先会在字符串常量池中查找,如果存在,则返回该字符串的引用,否则就在字符串常量池中创建一个新的字符串对象,并返回该字符串对象的引用。 后者是内存中就一份,可以被多个引用共享;前者是怎么都会在堆中产生对应的新空间给其使用。

下面对 c 和 d 对象地址进行比对会输出 false。

System.out.println(c==d);// false

所以

建议在使用字符串时,尽量使用直接字符串赋值方式,以便复用字符串常量池中的对象,避免不必要的内存占用和性能问题。

再来看看直接通过字符串的方式进行拼接。

	String e = "a" + "b";

字节码分析

深入底层谈谈String也就是和对象 c 指向应该为同一个地址。

System.out.println(c==e);//true

二、聊聊String实现(源码分析)

实现的接口

深入底层谈谈Stringpublic final class String implements java.io.Serializable, Comparable<String>, CharSequence

从这可以得出String类是final类型的,不允许你瞎拓展。
还有就是实现了Comparable接口,可以通过compareTo重写的方法进行字符串比较。

内部属性及其部分构造函数

内部属性

深入底层谈谈String重点看那个value数组,它是final类型的,这也是为什么说String字符串定义后永远不会变的原因。

构造函数,重点有几个

深入底层谈谈String这就是直接拿参数的value进行拷贝。

public String(String original) {this.value = original.value;this.hash = original.hash;}

这个就是调用copyOf方法==》System.arraycopy方法去进行拷贝。

public String(char value[]) {this.value = Arrays.copyOf(value, value.length);}

部分方法说明

  • equals方法(小编还是觉得挺简单的,没什么好说的,需要注意的是,虽然value是私有的,但传进来的String对象是在本类中使用的,所以也是可以调用value属性的。)
    public boolean equals(Object anObject) {if (this == anObject) {return true;}if (anObject instanceof String) {String anotherString = (String)anObject;int n = value.length;if (n == anotherString.value.length) {char v1[] = value;char v2[] = anotherString.value;int i = 0;while (n-- != 0) {if (v1[i] != v2[i])return false;i++;}return true;}}return false;}

明明replace,replaceAll,substring等方法得到了新的字符串,为什么说String是不变的呢?

为什么String对象是不可变的?

其实那个final类型的value数组就很明显了,至于方法为什么返回的是新的字符串,看源码的话非常清晰。这里拿一个replace和substring方法说明一下。

深入底层谈谈String

深入底层谈谈String
可以看见都是去new一个新的String对象。

三、总结

  • 字符串对象之间的拼接底层会创建一个空的StringBuilder对象,然后通过append方法进行拼接;如果是纯字符串拼接,那么底层会直接进行拼接,然后去字符串常量池中找。(字符串常量池是通过哈希表实现的,如果字符串存在的话就会返回其对应的引用)
  • String对象不可变性、不可拓展性源于起内部实现是一个final类型的value数组,String类是final型的。
  • substring等方法是返回一个新的String对象。

当然上面说的是jdk8中的String对象,在jdk9后String对象做了很多改变,比如底层不再是char数组,而是byte数组,高效的使用内存;还新增了一些静态方法…