String的转换问题

时间：2020-03-03 10:44:21 阅读：88 评论：0 收藏：0 [点我收藏+]

概述：记得有一次被一个技术人员面试，问我String是什么类型，如何和其他基本数据类型之间进行转换，那么今天就深入学习一下String

1、首先了解下JVM的体系结构图：

技术图片

注意：

栈：每个Java虚拟机线程都有自己的Java虚拟机栈，Java虚拟机栈用来存放栈帧，每个方法被执行的时候都会同时创建一个栈帧（Stack Frame）用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程，就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

堆：在虚拟机启动的时候创建，主要是用来存放对象实例的，几乎所有的对象实例都是在这里被分配的。

方法区：存储着每个类的结构信息，常量池，字段，方法数据，构造函数等，

常量池：分为两种，静态常量池和动态常量池，静态常量池存放在class文件中，动态常量池是方法区的一部分

Srtring在JVM层解析

创建字符串形式

首先形如声明为S ss是一个类S的引用变量ss（我们常常称之为句柄，后面JVM相关内容会讲到），而对象一般通过new创建。所以这里的ss仅仅是引用变量，并不是对象。

创建字符串的两种基本形式：

String s1=”1”;
String s2=new String(“1”);

技术图片

从图中可以看出，s1使用””引号（也是平时所说的字面量）创建字符串，在编译期的时候就对常量池进行判断是否存在该字符串，如果存在则不创建直接返回对象的引用；如果不存在，则先在常量池中创建该字符串实例再返回实例的引用给s1。注意：编译期的常量池是静态常量池，以后和会讲。。。。

再来看看s2，s2使用关键词new创建字符串，JVM会首先检查字符串常量池，如果该字符串已经存在常量池中，那么不再在字符串常量池创建该字符串对象，而直接堆中复制该对象的副本，然后将堆中对象的地址赋值给引用s2，如果字符串不存在常量池中，就会实例化该字符串并且将其放到常量池中，然后在堆中复制该对象的副本，然后将堆中对象的地址赋值给引用s2。注意：此时是运行期，那么字符串常量池是在运行时常量池中的。。。。

“+”连接形式创建字符串（更多可以查看API）：

（1）String s1=”1”+”2”+”3”;

技术图片

使用包含常量的字符串连接创建是也是常量，编译期就能确定了，直接入字符串常量池，当然同样需要判断是否已经存在该字符串。

（2）String s2=”1”+”3”+new String(“1”)+”4”;

技术图片

当使用“+”连接字符串中含有变量时，也是在运行期才能确定的。首先连接操作最开始时如果都是字符串常量，编译后将尽可能多的字符串常量连接在一起，形成新的字符串常量参与后续的连接（可通过反编译工具jd-gui进行查看）。

接下来的字符串连接是从左向右依次进行，对于不同的字符串，首先以最左边的字符串为参数创建StringBuilder对象（可变字符串对象），然后依次对右边进行append操作，最后将StringBuilder对象通过toString()方法转换成String对象（注意：中间的多个字符串常量不会自动拼接）。

实际上的实现过程为：String s2=new StringBuilder(“13”).append(new String(“1”)).append(“4”).toString();

当使用+进行多个字符串连接时，实际上是产生了一个StringBuilder对象和一个String对象。

（3）String s3=new String(“1”)+new String(“1”);

技术图片

这个过程跟（2）类似。。。。。。

String.intern()解析

String.intern()是一个Native方法，底层调用C++的 StringTable::intern 方法，源码注释：当调用 intern 方法时，如果常量池中已经该字符串，则返回池中的字符串；否则将此字符串添加到常量池中，并返回字符串的引用。

下面我们来看个案例：

public class StringTest {

public static void main(String[] args) {

// TODO 自动生成的方法存根

       String s3 = new String("1") + new String("1");

        System.out.println(s3 == s3.intern());



}

}

JDK6的执行结果为：false
JDK7和JDK8的执行结果为：true

JDK6的内存模型如下：

我们都知道JDK6中的常量池是放在永久代的，永久代和Java堆是两个完全分开的区域。而存在变量使用“+”连接而来的的对象存在Java堆中，且并未将对象存于常量池中，当调用 intern 方法时，如果常量池中已经该字符串，则返回池中的字符串；否则将此字符串添加到常量池中，并返回字符串的引用。所以结果为false。

JDK7JDK8的内存模型如下：

JDK7中，字符串常量池已经被转移至Java堆中，开发人员也对intern 方法做了一些修改。因为字符串常量池和new的对象都存于Java堆中，为了优化性能和减少内存开销，当调用 intern 方法时，如果常量池中已经存在该字符串，则返回池中字符串；否则直接存储堆中的引用，也就是字符串常量池中存储的是指向堆里的对象。所以结果为true。

String典型案例

关于equals和== ：

（1）对于==，如果作用于基本数据类型的变量（byte,short,char,int,long,float,double,boolean ），则直接比较其存储的"值"是否相等；如果作用于引用类型的变量（String），则比较的是所指向的对象的地址（即是否指向同一个对象）。

（2）equals方法是基类Object中的方法，因此对于所有的继承于Object的类都会有该方法。在Object类中，equals方法是用来比较两个对象的引用是否相等。

（3）对于equals方法，注意：equals方法不能作用于基本数据类型的变量。如果没有对equals方法进行重写，则比较的是引用类型的变量所指向的对象的地址；而String类对equals方法进行了重写，用来比较指向的字符串对象所存储的字符串是否相等。其他的一些类诸如Double，Date，Integer等，都对equals方法进行了重写用来比较指向的对象所存储的内容是否相等。

public class StringTest {

public static void main(String[] args) {

// TODO 自动生成的方法存根

        /**
         * 情景一：字符串池
          * JAVA虚拟机(JVM)中存在着一个字符串池，其中保存着很多String对象;
         * 并且可以被共享使用，因此它提高了效率。
         * 由于String类是final的，它的值一经创建就不可改变。
         * 字符串池由String类维护，我们可以调用intern()方法来访问字符串池。
         */

        String s1 = "abc";

        //↑ 在字符串池创建了一个对象

        String s2 = "abc";

        //↑ 字符串pool已经存在对象“abc”(共享),所以创建0个对象，累计创建一个对象

        System.out.println("s1 == s2 : "+(s1==s2));

        //↑ true 指向同一个对象，

        System.out.println("s1.equals(s2) : " + (s1.equals(s2)));

        //↑ true 值相等

        //↑------------------------------------------------------over

        /**
         * 情景二：关于new String("")
         *
         */

        String s3 = new String("abc");

        //↑ 创建了两个对象，一个存放在字符串池中，一个存在与堆区中；

        //↑ 还有一个对象引用s3存放在栈中

        String s4 = new String("abc");

        //↑ 字符串池中已经存在“abc”对象，所以只在堆中创建了一个对象

        System.out.println("s3 == s4 : "+(s3==s4));

        //↑false   s3和s4栈区的地址不同，指向堆区的不同地址；

        System.out.println("s3.equals(s4) : "+(s3.equals(s4)));

        //↑true s3和s4的值相同

        System.out.println("s1 == s3 : "+(s1==s3));

        //↑false 存放的地区多不同，一个栈区，一个堆区

        System.out.println("s1.equals(s3) : "+(s1.equals(s3)));

        //↑true 值相同

        //↑------------------------------------------------------over

        /**
         * 情景三：
         * 由于常量的值在编译的时候就被确定(优化)了。
         * 在这里，"ab"和"cd"都是常量，因此变量str3的值在编译时就可以确定。
         * 这行代码编译后的效果等同于： String str3 = "abcd";
         */

        String str1 = "ab" + "cd"; //1个对象

        String str11 = "abcd";

        System.out.println("str1 = str11 : "+ (str1 == str11));

        //↑------------------------------------------------------over

        /**
         * 情景四：
         * 局部变量str2,str3存储的是存储两个拘留字符串对象(intern字符串对象)的地址。
         *
         * 第三行代码原理(str2+str3)：
         * 运行期JVM首先会在堆中创建一个StringBuilder类，
         * 同时用str2指向的拘留字符串对象完成初始化，
         * 然后调用append方法完成对str3所指向的拘留字符串的合并，
         * 接着调用StringBuilder的toString()方法在堆中创建一个String对象，
         * 最后将刚生成的String对象的堆地址存放在局部变量str4中。
         *
         * 而str5存储的是字符串池中"abcd"所对应的拘留字符串对象的地址。
         * str4与str5地址当然不一样了。
         *
         * 内存中实际上有五个字符串对象：
         *       三个拘留字符串对象、一个String对象和一个StringBuilder对象。
         */

        String str2 = "ab"; //1个对象

        String str3 = "cd"; //1个对象

        String str4 = str2+str3;

        String str5 = "abcd";

        System.out.println("str4 = str5 : " + (str4==str5)); // false

        //↑------------------------------------------------------over

        /**
         * 情景五：
         * JAVA编译器对string + 基本类型/常量是当成常量表达式直接求值来优化的。
         * 运行期的两个string相加，会产生新的对象的，存储在堆(heap)中
         */

        String str6 = "b";

        String str7 = "a" + str6;

        String str67 = "ab";

        System.out.println("str7 = str67 : "+ (str7 == str67));

        //↑str6为变量，在运行期才会被解析。

        final String str8 = "b";

        String str9 = "a" + str8;

        String str89 = "ab";

        System.out.println("str9 = str89 : "+ (str9 == str89));

        //↑str8为常量变量，编译期会被优化

        //↑------------------------------------------------------over

}

}