String

About 2734 wordsAbout 9 min

java源码

2025-01-15

一、String类的基础理解

public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
  	// 用来存储字符串的内容
    private final char value[];
    private int hash;
}

String类由final修饰，并实现了Serializable、Comparable、CharSequence.

由final修饰表示String类不能被继承，成员变量也是由final修饰，String类一旦创建就不能修改。

    private final char value[];

String是由char数组保存实现。

创建String对象的几种方式：

String s = new String("hello");
String s = "hello";

String str = "abc";
// 等价于先创建一个char[]数组，然后创建出String
char data[] = {'a', 'b', 'c'};
String str = new String(data);

String 被设置成不可变性的原因？

主要是为了效率和安全性的缘故。如果String允许被继承，由于他高度被使用率，可能会降低程序的性能，所以String被定义成final
由于字符串常量池的存在，为了更加有效的管理和优化字符串常量池里面的对象，将Strng设计成不可变性。
安全性考虑。因为使用字符串的场景非常多，设计成不可变可以有效的防止字符串被有意或者无意的修改。
作为HashMap、HashTable等hash数据key的必要，因为不可变的设计，jvm底层很容易在缓存String对象的时候缓存其hashcode，这样在执行效率上会大大提升。

这里补充一下字符串常量池的知识点：深入理解Java字符串常量池

我们就用String s = new String("小邓"); 这个例子来说，问这个语句会创建几个对象？

当字符串常量池里面没有小邓的时候，先会在常量池里面创建一个小邓，然后在堆里面创建一个小邓；如果常量池里面有小邓，那么就只会在堆里面创建一个小邓。

在java中，栈上存储的是基本数据类型的变量和对象的引用，而对象本身则存储在堆上，同时引用变量s存储在栈上，他指向堆内存中的字符串小邓。

通常情况下，我们是使用String s = “小邓”；来创建变量的时候，先在常量池里面找是否存在，如果存在的话，直接返回；如果不存在的话，就在常量池里面创建一个小邓的对象，然后将地址返回。

这里有一个需要注意的地方，在java中使用+连接符号是，一定要注意+的连接效率是非常低的，因为+连接符的原理就是通过StringBuilder的append()来实现的，所以如: String name = "a" + "b"; 在底层是先new出一个StringBuilder对象，然后在调用该对象的append()方法来实现的:

// String s = "a" + "b";
String s = new StringBuilder().append("a").append("b").toString();

常量可以被认为运行是不可改变，所以编译时被以常量折叠方式优化。

变量和动态生成的常量必须在运行时确定值，所以不能在编译期折叠优化。

String的equals方法

equals比较的是字符串内容是否相等

String的hashcode方法

在String类中，有一个字段hash存储着String的哈希值，如果字符串为空，则hash值为0，String类中的hashcode计算方法就是以31为权，每一位为字符的ASCLL值进行运算，用自然溢出来等效取模，经过第一次的hashcode计算之后，属性hash就会赋哈希值

String的hashcode()和equals()

String的equals是比较的两个字符串的内容；hashcode是比较的字符串的hash值，那么问题来来，单纯的equals相等，或者hash值相等，能判断两个字符串相同吗？答案是不能的。

String a = "gdejicbegh";
String b = "hgebcijedg";
System.out.println("a.hashcode() == b.hashcode() " + (a.hashCode() == b.hashCode()));  // true
System.out.println("a.equals(b) " + (a.equals(b)));  // false

回文串是典型的hash值相等，但是字符串内容不相等，对于算法领域这块，回文字符串和字符串匹配都是比较重要的一块，比如马拉车算法、KMP算法。

如果两个对象的equals相等，则他们的hashcode一定相等
如果两个对象的equals不相等，他们的hashcode可能相等； // 回文字符串
如果两个对象的hashcode相等，则他们equals不一定相等
如果两个对象的hashcode不相等，则他们的equals一定不相等。

二、String类相关的方法

public boolean equals(Object another)

这里的this表示什么含义？表示当前对象

先判断传入对象是否等于当前对象，如果是直接返回true；判断another是否是String类型，如果是将another转成String，先判断长度是否一致，在循环判断每一位是否相同。

    public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
              	// n-- != 0表示循环次数，真正的位置是i
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
              	/**
              	for(int i = 0;i < n; i++){
                  if(v1[i] != v2[i])
                    return false;
                }
                */
                return true;
            }
        }
        return false;
    }

public int hashcode()

public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

public int compareTo(String anotherString)

String类实现Comparable接口，实现了compareTo接口。

    public int compareTo(String anotherString) {
        int len1 = value.length;
        int len2 = anotherString.value.length;
      	// 以小驱动
        int lim = Math.min(len1, len2);
        char v1[] = value;
        char v2[] = anotherString.value;

        int k = 0;
        while (k < lim) {
            char c1 = v1[k];
            char c2 = v2[k];
          	// 从头往后比较，遇到不想等的直接返回c1-c2
            if (c1 != c2) {
                return c1 - c2;
            }
          	// 相同指针后移
            k++;
        }
      	// 如果前lim个字符都相同的话，就返回len1-len2
        return len1 - len2;
    }

String的compareTo方法是比较的最低位不同字符的ascll码的差值，如果最低位都相等的话，就返回字符串长度的差值。

public String(char value[])

String的构造函数好多，都给我看花眼了。

    public String(char value[]) {
        this.value = Arrays.copyOf(value, value.length);
    }

public int length()

求字符串长度的方法，返回char[]数组的长度。

    public int length() {
        return value.length;
    }

public boolean isEmpty()

判断字符串是否为空，判断字符串的char[]数组的长度是否为0.

    public boolean isEmpty() {
        return value.length == 0;
    }

public char charAt(int index)

返回字符串对应下标index的字符，获取char[]数组对应下标的字符。

    public char charAt(int index) {
      	// 校验下标index的合法性
        if ((index < 0) || (index >= value.length)) {
            throw new StringIndexOutOfBoundsException(index);
        }
        return value[index];
    }

void getChars(char dst[], int dstBegin)

void getChars(char dst[], int dstBegin) {
    System.arraycopy(value, 0, dst, dstBegin, value.length);
}

System.arraycopy()

System.arraycopy()方法是Java中的本地方法，其实际实现是由Java虚拟机的底层实现提供的。native修饰。

System.arraycopy()方法的性能非常高，因为它是由底层实现的，并且能够利用硬件的特性来进行快速的数据复制。通常比使用循环逐个复制数组元素要快得多

public static native void arraycopy(Object src, int srcPos,Object dest, int destPos,int length);

src：源数组
srcPos：源数组中的起始位置
dest：目标数组
destPos：目标数组中的起始位置
length：要复制的元素个数

Arrays.copyOf()

    @SuppressWarnings("unchecked")
    public static <T> T[] copyOf(T[] original, int newLength) {
        return (T[]) copyOf(original, newLength, original.getClass());
    }
    public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
      	// 创建对应类型的数组。
        @SuppressWarnings("unchecked")
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
      	// 底层还是使用的System.arraycopy来复制的
        System.arraycopy(original, 0, copy, 0, Math.min(original.length, newLength));
        return copy;
    }

original：要复制的原始数组
newLength：新数组的长度，它可以比原数组的长度长或者短。
newType：新数组的类型，是一个Class对象，通常是一个数组类。它用于确定新数组的类型。

public boolean startsWith(String prefix, int toffset)

判断字符串是否以prefix开头。

    public boolean startsWith(String prefix, int toffset) {
        char ta[] = value;
        int to = toffset;
        char pa[] = prefix.value;
        int po = 0;
        int pc = prefix.value.length;
        // Note: toffset might be near -1>>>1.
      	// 控制下标toffset的范围，toffset + pc > value.length -> toffset > value.length - pc
        if ((toffset < 0) || (toffset > value.length - pc)) {
            return false;
        }
      	// 这里--pc和pc--应该是相同的作用，就是用来控制循环次数的
      	// for循环需要维护额外的循环变量，直接用前面定义好的pc这个变量来维护循环次数
        while (--pc >= 0) {
            if (ta[to++] != pa[po++]) {
                return false;
            }
        }
        return true;
    }
    public boolean startsWith(String prefix) {
        return startsWith(prefix, 0);
    }
    public boolean endsWith(String suffix) {
      	// endsWith 调用startsWith，下标为value.length - suffix.value.length
        return startsWith(suffix, value.length - suffix.value.length);
    }

public String subString(int beginIndex, int endIndex)

求字符串指定beginIndex到endIndex的子串。

使用String的构造函数创建新的字符串，new String(value, beginIndex, subLen) ；

public String substring(int beginIndex, int endIndex) {
    if (beginIndex < 0) {
        throw new StringIndexOutOfBoundsException(beginIndex);
    }
    if (endIndex > value.length) {
        throw new StringIndexOutOfBoundsException(endIndex);
    }
    int subLen = endIndex - beginIndex;
    if (subLen < 0) {
        throw new StringIndexOutOfBoundsException(subLen);
    }
    return ((beginIndex == 0) && (endIndex == value.length)) ? this
            : new String(value, beginIndex, subLen);
}

public String concat(String str)

判断str是否为空，如果为空直接返回当前字符串；

不为空的话，新建一个 value.length + str.length()的新char[]数组，然后拷贝进去创建新的字符串。

public String concat(String str) {
    if (str.isEmpty()) {
        return this;
    }
    int len = value.length;
    int otherLen = str.length();
  	// Arrays.copyOf(源数组，新数组长度)
    char buf[] = Arrays.copyOf(value, len + otherLen);
    str.getChars(buf, len);
    return new String(buf, true);
}

public char[] toCharArray

将字符串转化成char[]数组，就是将value数组的值复制一份，然后返回。

public char[] toCharArray() {
    // Cannot use Arrays.copyOf because of class initialization order issues
    char result[] = new char[value.length];
    System.arraycopy(value, 0, result, 0, value.length);
    return result;
}

三、字符串常量池

刚才突然想到了字符串常量池，简单了解一下。

String x = new String("邓哈哈");

上面代码经历了哪些过程？

使用new关键词创建字符串对象，java虚拟机会先在字符串常量池里面查找有没有想等的对象，如果有的话，就在堆上创建一个“邓哈哈”的对象，然后将地址赋值到x；如果字符串常量池里面没有的话，就会先在常量池里面创建对象，然后在堆上再创建一个对象。

但是我们进场使用双引号来创建字符串对象。

String y = "邓哈哈";

先还是会在字符串常量池里面查找有没有对象，如果有的话，直接将常量池里面对应的对象地址赋值给y；如果没有的话，就会先创建，然后在赋值给y。

字符串常量池 - 设计思路 1/3

字符串常量池 -StringTable 源码实现 2/3

字符串常量池 -String.intern 源码实现 3/3

Changelog

7/19/25, 4:20 PM

View All Changelog

c089a-Merge branch 'dev1'on 7/19/25

java.lang

java.util

concurrent

java.time

com.alibaba.fastjson