标签:效率 存储 图形 面试 常见 use 制造 code 答案
关于 Java String,这是面试的基础,但是还有很多童鞋不能说清楚,所以本文将简单而又透彻的说明一下那个让你迷惑的 String在 Java 中,我们有两种方式创建一个字符串
String x = "abc";
String y = new String("abc");
你常见也常写第一种,很少见第二种,但面试还总问这类问题,双引号和构造器两种形式创建字符串到底有什么差别呢?
先来看例子
例子
例子 1
String a = "abcd";
String b = "abcd";
System.out.println(a == b); // True
System.out.println(a.equals(b)); // True
a == b 结果为 true,是因为 a 和 b 都指向 方法区(method area) 同一个字符串文字,内存引用是同一个
当多次创建相同的字符串文字时,只存储每个不同字符串值的一个副本。这个叫做字符串留驻/留用,Java 中所有编译期字符串常量都会被自动留驻
例子 2
String c = new String("abcd");
String d = new String("abcd");
System.out.println(c == d); // False
System.out.println(c.equals(d)); // True
c==d 结果为 false,因为 c 和 d 的引用指向堆中不同的对象,不同的对象肯定有不同的内存引用
举了两个例子,文字描述有点懵?我们来试图通过图形来理解上述两种情况:
也许你已经看看出来了,一个是在方法区,一个是在堆中,在 JVM 模型中这是两个不同的区域,也许你面试时也经常被问到吧,来看下图:
再次提醒一下,所有 new 的对象都会在 Heap 中,这样以后你就好区分了
运行期字符串留驻
上面说的字符串留驻是在编译期,那么运行期可以吗?答案是肯定的,我们需要一个函数来帮忙
String c = new String("abcd").intern();
String d = new String("abcd").intern();
System.out.println(c == d); // Now true
System.out.println(c.equals(d)); // True
看到 c == d 结果为 true,你应该理解 intern (英文有拘留,软禁的意思)的作用了,通过调用 intern()方法,就好比把创建的字符串拘留在方法区一样了
在面试时甚至还会问你下面代码创建了几个对象:
String d = new String("abcd")
如果方法区已存在"abcd", 那么只创建一个 new String 的对象
如果方法区没有"abcd", 那么要创建两个对象,一个在方法区,一个在堆中
所以,正常情况下我们没必要使用构造器创建对象,因为这很可能会产生一个额外的没用的对象,但是有例外哦,我们下面说
String s = "abcd";
s = s.concat("ef");
当我们想在字符串 s 后面拼接字符"ef"时,会在堆中创建一个新的对象,并将 s 的引用指向新创建的对象,由于 String 创建的是不可变对象,所以 String 类中的所有方法都不会改变它自身,而是返回一个新的字符串(快打开你的 IDE,看看是否每个操作String 的方法最后都是返回有 return new String 字样),到这里你也应该理解了一个道理:
如果我们需要一个字符串被修改,我们最好使用 StringBuffer 或者 StringBuilder,否则,由于每次操作字符串都会创建一个新的对象,而旧的对象不会有引用指向它,这样我们会浪费很多垃圾回收的时间
到这里还没完,你有没有想过为什么 String 会被设置/制造成 final?
为什么 String 类被 final 修饰
字符串池的需求
字符串池(String intern pool)是方法区域中的一个特殊存储区域。当创建一个字符串时,如果该字符串已经存在于池中,那么返回现有字符串的引用,而不是创建一个新对象。所以说,如果一个字符串是可变的,那么改变一个引用的值,将导致原本指向该值的引用获取到错误的值
缓存 hashcode
字符串的hashcode在Java中经常使用。例如,在HashMap或HashSet中。不可变保证hashcode始终是相同的,这样就可以在不担心更改的情况下兑现它。这意味着,不需要每次使用hashcode时都计算它。这样更有效率。所以你会在 String 类中看
到下面的成员变量的定义:
/** Cache the hash code for the string */
private int hash; // Default to 0
安全性
String被广泛用作许多java类的参数,例如网络连接、打开文件等。如果字符串不是不可变的,连接或文件将被更改,这可能导致严重的安全威胁。该方法认为它连接到一台机器上,但实际上并没有。可变字符串也可能导致反射中的安全问题,因为参数是字符串。
不可变对象天生是线程安全的
由于不可变对象不能被更改,所以它们可以在多个线程之间自由共享。这消除了同步的需求。
总之,出于效率和安全性的考虑,String 被设计为不可变的。这也是为什么在一般情况下,不可变类是首选的原因。
附加说明
关于不可变对象和不可变引用总是有同学搞不清楚
final User user = new User();
上面的代码指的是 user 引用不能被更改指向内存的其他地址,但是由于 User 是可变对象,我们可以调用 user 的 setter 方法修改其属性
在String类中包含很多学问,包括你对JVM模型的理解,这也就是为什么面试官为什么喜欢问String,主要考察你的基本功
灵魂追问
String 和基本类型的包装类如 Integer 和 Long 都被 final 修饰,但为什么不建议作为 synchronized 同步块的参数使用呢?
基本类型自动装箱你知道发生了什么吗?
提高效率工具
推荐阅读
欢迎思想碰撞,点我留言交流
tan日拱一兵
转发在看也很赞
喜欢作者
标签:效率 存储 图形 面试 常见 use 制造 code 答案
原文地址:https://blog.51cto.com/14888355/2515712