标签:type 个数 ant netbeans attr 包含 ide beans com
1.概述
方法表集合是指由若干个方法表(method_info)组成的集合。对于在类中定义的若干个,经过JVM编译成class文件后,会将相应的method方法信息组织到一个叫做方法表集合的结构中,字段表集合是一个类数组结构,如下图所示:
method方法的描述-方法表集合紧跟在字段表集合的后面(想了解字段表集合的读者可以点击我查看),如下图所示:
接下来让我们看看Method_info 结构体是怎么组织method方法信息的:
实际上JVM还会对method方法的描述添加其他信息,我们将在后面详细讨论。如上图中的method_info结构体的定义,该结构体的定义跟描述field字段 的field_info结构体的结构几乎完全一致,如下图所示。
方法表的结构体由:访问标志(access_flags)、名称索引(name_index)、描述索引
(descriptor_index)、属性表(attribute_info)集合组成。
访问标志(access_flags):
method_info结构体最前面的两个字节表示的访问标志(access_flags),记录这这个方法的作用域、静态or非静态、可变性、是否可同步、是否本地方法、是否抽象等信息,实际上不止这些信息,我们后面会详细介绍访问标志这两个字节的每一位具体表示什么意思。
名称索引(name_index):
紧跟在访问标志(access_flags)后面的两个字节称为名称索引,这两个字节中的值指向了常量池中的某一个常量池项,这个方法的名称以UTF-8格式的字符串存储在这个常量池项中。如public void methodName(),很显然,"methodName"则表示着这个方法的名称,那么在常量池中会有一个 CONSTANT_Utf8_info格式的常量池项,里面存储着"methodName"字符串,而mehodName()方法的方法表中的名称索引则指向了这个常量池项。
描述索引(descriptor_index):描述索引表示的是这个方法的特征或者说是签名,一个方法会有若干个参数和返回值,而若干个参数的数据类型和返回值的数据类型构成了这个方法的描述,其基本格式为: (参数数据类型描述列表)返回值数据类型 。我们将在后面继续讨论。就是返回值了,是什么类型的返回值,还是没有返回值了。
属性表(attribute_info)集合:
这个属性表集合非常重要,方法的实现被JVM编译成JVM的机器码指令,机器码指令就存放在一个Code类型的属性表中;如果方法声明要抛出异常,那么异常信息会在一个Exceptions类型的属性表中予以展现。Code类型的属性表可以说是非常复杂的内容,也是本文最难的地方。
接下来,我们将一一击破它们,看看它们到底是怎么表示的。
访问标志(access_flags)共占有2 个字节,分为16 位,这 16位 表示的含义如下所示:
举例:某个类中定义了如下方法:
1. public static synchronized final void greeting(){
}
greeting()方法的修饰符有:public、static、synchronized、final 这几个修饰符修饰,那么相对应地,greeting()方法的访问标志中的ACC_PUBLIC、
ACC_STATIC、ACC_SYNCHRONIZED、ACC_FINAL标志位都应该是1,即:
从上图中可以看出访问标志的值应该是二进制00000000 00111001,即十六进制
0x0039。我们将在文章的最后一个例子中证实这里点。
紧 接 着 访 问 标 志 ( access_flags ) 后 面 的 两 个 字 节 , 叫 做 名 称 索 引 (name_index),这两个字节中的值是指向了常量池中某个常量池项的索引,该常量池项表示这这个方法名称的字符串。
方法描述符索引(descrptor_index)是紧跟在名称索引后面的两个字节,这两个字节中的值跟名称索引中的值性质一样,都是指向了常量池中的某个常量池项。这两个字节中的指向的常量池项,是表示了方法描述符的字符串。
所谓的方法描述符,实质上就是指用一个什么样的字符串来描述一个方法,方法描述符的组成如下图所示:
举例:对于如下定义的的greeting()方法,我们来看一下对应的method_info结构体中的名称索引和描述符索引信息是怎样组织的。
如下图所示,method_info结构体的名称索引中存储了一个索引值x,指向了常量池中的第x 项,第 x项表示的是字符串"greeting",即表示该方法名称是"greeting";描述符索引中的y 值指向了常量池的第y项,该项表示字符串"()V",即表示该方法没有参数,返回值是void 类型。(说白了一句话话就是我这个方法的方法名称是是什么就是通过这个x(名称索引)指向常量表中,而y(描述索引)是什么就是看有没有返回值的。)
6.属性表集合--记录方法的机器指令和抛出异常等信息
属性表集合记录了某个方法的一些属性信息,这些信息包括:
这个方法的代码实现,即方法的可执行的机器指令
这个方法声明的要抛出的异常信息
这个方法是否被@deprecated注解表示这个方法是否是编译器自动生成的
属性表(attribute_info)结构体的一般结构如下所示:
6.1 Code类型的属性表--method方法中的机器指令的信息
Code类型的属性表(attribute_info)可以说是class文件中最为重要的部分,因为它包含的是JVM可以运行的机器码指令,JVM能够运行这个类,就是从这个属性中取出机器码的。除了要执行的机器码,它还包含了一些其他信息,如下所示:
Code属性表的组成部分:
机器指令----code:
目前的JVM使用一个字节表示机器操作码,即对JVM底层而言,它能表示的机器操作码不多于2的8 次方,即 256个。class文件中的机器指令部分是class文件中最重要的部分,并且非常复杂,本文的重点不止介绍它,我将专门在一片博文中讨论它,敬请期待。
异常处理跳转信息---exception_table:
如果代码中出现了try{}catch{}块,那么try{}块内的机器指令的地址范围记录下来,并且记录对应的catch{}块中的起始机器指令地址,当运行时在try块中有异常抛出的话,
JVM会将catch{}块对应懂得其实机器指令地址传递给PC寄存器,从而实现指令跳转;
Java源码行号和机器指令的对应关系---LineNumberTable属性表:编译器在将java源码编译成class文件时,会将源码中的语句行号跟编译好的机器指令关联起来,这样的class文件加载到内存中并运行时,如果抛出异常,JVM可以根据这个对应关系,抛出异常信息,告诉我们我们的源码的多少行有问题,方便我们定位问题。这个信息不是运行时必不可少的信息,但是默认情况下,编译器会生成这一项信息,如果你项取消这一信息,你可以使用-g:none 或-g:lines来取消或者要求设置这一项信息。如果使用了-
g:none来生成class文件,class文件中将不会有LineNumberTable属性表,造成的影响就是 将来如果代码报错,将无法定位错误信息报错的行,并且如果项调试代码,将不能在此类中打断点(因为没有指定行号。)局部变量表描述信息----LocalVariableTable属性表:
局部变量表信息会记录栈帧局部变量表中的变量和java源码中定义的变量之间的关系,这个信息不是运行时必须的属性,默认情况下不会生成到class文件中。你可以根据javac指令的-g:none或者-g:vars选项来取消或者设置这一项信息。它有什么作用呢? 当我们使用
IDE进行开发时,最喜欢的莫过于它们的代码提示功能了。如果在项目中引用到了第三方的 jar包,而第三方的包中的class文件中有无LocalVariableTable属性表的区别如下所示:
Code属性表结构体的解释:
1.attribute_name_index,属性名称索引,占有2个字节,其内的值指向了常量池中的某一项,该项表示字符串"Code";
"LineNumberTable"类型的属性表记录着Java源码和机器指令之间的对应关系
"LocalVariableTable"类型的属性表记录着局部变量描述
举例:
如下定义Simple类,使用javac -g:none Simple.java 编译出Simple.class 文件,并使用javap
-v Simple > Simple.txt 查看反编译的信息,然后看Simple.class文件中的方法表集合是怎样组织的:
如上所示,方法表集合使用了蓝色线段圈了起来。
请注意:方法表集合的头两个字节,即方法表计数器(method_count)的值是 0x0002,它表示该类中有2个方法。细心的读者会注意到,我们的Simple.java中就定义了一个greeting()方法,为什么class文件中会显示有两个方法呢??
在Simple.classz中出现了两个方法表,分别代表构造方法()和greeting()方法,现在让我们分别来讨论这两个方法:
解释:
3.描述符索引(descriptor_index): 占有 2个字节,值为0x0005,指向常量池的第 5 项,该项表示字符串"()V",即表示该方法不带参数,并且无返回值
(构造函数确实也没有返回值);
0x0006,指向常量池中的第6 项,该项表示字符串"Code",表示这个属性表是Code类型的属性表;
0x0001,JVM在调用该方法时,根据这个值设置栈帧中的局部变量表的大小;
0xB7、 0x00、0x01、0xB1;
生成Code属性表的 LineNumberTable 和LocalVariableTable;
B. Simple.class 中的greeting() 方法:
解释:
00000000 00111001,即标志位的第11、12、13、16位为1,根据上面讲的方法 标 志 位 的 表 示 , 可 以 得 到 该 greeting() 方 法 的 修 饰 符 有 :
ACC_SYNCHRONIZED、ACC_FINAL、ACC_STATIC、ACC_PUBLIC;
含有一个属性表,后面会紧跟着一个属性表;
5.属性表的名称索引(attribute_name_index):占有 2个字节,值为0x0006,指向常量池中的第6项,该项表示字符串"Code",表示这个属性表是Code类型的属性表;
10.机器指令集(code[code_length]):这里共有4个字节,值为0x10、 0x0A、 0x3B、0xB1 ;
生成Code属性表的 LineNumberTable 和LocalVariableTable;
6.2 Exceptions类型的属性表----method方法声明的要抛出的异常信息
有些方法在定义的时候,会声明该方法会抛出什么类型的异常,如下定义一个
Interface接口,它声明了sayHello()方法,抛出Exception异常:
1. package com.louis.jvm;
现在让我们看一下Exceptions类型的属性表(attribute_info)结构体是怎样组织的:
如上图所示,Exceptions类型的属性表(attribute_info)结构体由一下元素组成:
属性名称索引(attribute_name_index):占有 2个字节,其中的值指向了常量池中的表示"Exceptions"字符串的常量池项;
属性长度(attribute_length):它比较特殊,占有4个字节,它的值表示跟在其后面多少个字节表示异常信息;
异常数量(number_of_exceptions):占有2 个字节,它的值表示方法声明抛出了多少个异常,即表示跟在其后有多少个异常名称索引;异常名称索引(exceptions_index_table):占有2个字节,它的值指向了常量池中的某一项,该项是一个CONSTANT_Class_info类型的项,表示这个异常的完全限定名称;
Exceptions类型的属性表的长度计算
如果某个方法定义中,没有声明抛出异常,那么,表示该方法的方法表 (method_info)结构体中的属性表集合中不会有Exceptions类型的属性表;换句话说,如果方法声明了要抛出的异常,方法表(method_info)结构体中的属性表集合中必然会有Exceptions类型的属性表,并且该属性表中的异常数量不小于
1。
我们假设异常数量中的值为 N,那么后面的异常名称索引的数量就为N,它们总共占有的字节数为N*2,而异常数量占有2个字节,那么将有下面的这个关系式:
属 性 长 度 (attribute_length) 中 的 值 = 2 + 2* 异 常 数 量
(number_of_exceptions)中的值
Exceptions 类 型 的 属 性 表 ( attribute_info ) 的 长 度 =2+4+ 属 性 长 度
(attribute_length)中的值
举例:
将上面定义的Interface接口类编译成class文件,然后我们查看Interface.class 文件,找出方法表集合所在位置和相应的数据,并辅助javap -v Inerface 查看常量池信息,如下图所示:
由于sayHello()方法是在的Interface接口类中声明的,它没有被实现,所以它对应的方法表(method_info)结构体中的属性表集合中没有Code类型的属性表。注:
(method_info)就一个,即我们就定义了一个方法,其后会紧跟着一个方法表
(method_info)结构体;
会被解析成属性值;
出的异常个数是1个;
9.异常名称索引(exception_index_table)中的值为0x0008,指向了常量池中的第
8 项 , 第 8 项 表 示 的 是 CONSTANT_Class_info 类 型 的 常 量 池 项 , 表示"java/lang/Exception",即表示此方法抛出了java.lang.Exception异常。
注解:06指向的是code
07指向的是exception
现在对于企业级的开发,开发者们越来越依赖IDE如Intellij IDEA、Eclipse、MyEclipse、
NetBeans等,利用他们提供的高级功能,可以极大地提高编码的速度和效率。
每个IDE都提供了代码提示功能,它们实现的基本原理其实就是IDE针对它们项目下的包中所有的class文件进行建模,解析出它们的方法信息,当我们一定的条件时,IDE会自动地将合适条件的方法列表展示给开发者,供开发者使用。
在 上 面 将 Code 属 性 表 的 时 候 也 讲 了 , 如 果 编 译 的 第 三 方 包 , 没 有
LocalVariableTable属性表信息,IDE的提示信息会稍有不同:
以上就是Class文件的方法表集合的全部内容。
读者可能觉得本文关于方法表的Code属性表讨论的不够深入,在讨论Code属性表的时候,我简单介绍了它的两个属性表LineNumberTable 和LocalVariableTable这两个在有什么实际作用,但是没有详细第介绍它们,并且在列举的例子中,刻意地使用了 -g:none 选项 ,以使生成的class文件没有这两项信息,这么做是因为Code 属性太过复杂,而本文主要是想让读者了解的是 方法表集合,所以就生成了最精简的Code属性表,以减少读者的负担。
接下来的一篇文章,我打算专门来讨论Code属性表,揭开Code属性表的所有秘密,敬请关注~~
本文还引出了一个需要讨论的话题:就是Code属性表中的机器指令,机器指令的运行要依赖于JVM体系结构的设计机制,理解机器指令的运行机制,这将是根非常非常难啃的骨
头.......
标签:type 个数 ant netbeans attr 包含 ide beans com
原文地址:https://www.cnblogs.com/qingruihappy/p/9691430.html