[转帖]【JVM】类文件结构

jvm,文件,结构 · 浏览次数 : 0

小编点评

**Class 文件定义** 一个 Class 文件是一个以 8 字节为基础的二进制流,包含多个数据项目按照顺序排列。每个数据类型都有明确的定义,例如无符号数用于描述数字、表用于描述有层次关系的数据等。 **类文件结构** * **魔数**:首 4 字节,用于确定文件是否为可被虚拟机识别的 Class 文件。 * **版本号**:紧跟魔数,包含两个字节,用于表示版本号。 * **常量池入口**:存放常量值的表,包含 2 字节的索引值和相应的值。 * **访问标志**:描述类的继承关系。 * **类索引、父类索引和接口索引集合**:用于确定类继承关系。 * **字段表集合**:描述类的属性。 * **方法表集合**:描述类的方法。 * **属性表集合**:描述类的属性。 **主要数据类型** * **无符号数**:用于存储数值类型,如整数和浮点数。 * **表**:用于存储具有层次结构的数据,如 Map 和集合。 * **访问标志**:用于描述类的访问权限。 * **类索引、父类索引和接口索引**:用于描述类继承关系。 * **字段表**:用于描述类的属性。 * **方法表**:用于描述类的方法。 * **属性表**:用于描述类的属性。

正文

Class文件的定义

  • 一组以8字节为基础单位的二进制流,

  • 各个数据项目严格按照顺序紧凑排列在class文件中,

  • 中间没有任何分隔符,这使得class文件中存储的内容几乎是全部程序运行的程序。

注:Java虚拟机规范规定,Class文件格式采用类似C语言结构体的伪结构来存储数据,这种结构只有两种数据类型:无符号数和表。

无符号数

属于基本数据类型,主要可以用来描述数字、索引符号、数量值或者按照UTF-8编码构成的字符串值,大小使用u1、u2、u4、u8分别表示1字节、2字节、4字节和8字节。

1.定义

  • 由多个无符号数或者其他表作为数据项构成的复合数据类型,所有的表都习惯以“_info”结尾。

  • 表主要用于描述有层次关系的复合结构的数据,比如方法、字段。需要注意的是class文件是没有分隔符的,所以每个的二进制数据类型都是严格定义的。

整个class文件本质上就是一张表,具体内容如下图所示

这里写图片描述

由上表可以看出:class文件主要由魔数、Class文件的版本号、常量池、访问标志、类索引(还包括父类索引和接口索引集合)、字段表集合、方法表集合、属性表集合组成。

2.实例

public class TestClass {
        private int m;
    <span class="hljs-keyword">public</span> <span class="hljs-keyword">int</span> <span class="hljs-title">inc</span>(){
            <span class="hljs-keyword">return</span> m+<span class="hljs-number">1</span>;
    }

}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

TestClass.class的二进制结构如下图所示

这里写图片描述

根据这张图,我接下来进行详细分析

3.魔数

这里写图片描述

  • 每个Class文件的头4个字节称为魔数(Magic Number)

  • 唯一作用是用于确定这个文件是否为一个能被虚拟机接受的Class文件。

  • Class文件魔数的值为0xCAFEBABE。如果一个文件不是以0xCAFEBABE开头,那它就肯定不是Java class文件

注: 很多文件存储标准中都使用魔数来进行身份识别,譬如图片格式,如gif或jpeg等在文件头中都存有魔数

4.Class文件的版本号

这里写图片描述

(1)紧接着魔数的4个字节是Class文件版本号,而版本号又分为:

  • 次版本号(minor_version): 前2字节用于表示次版本号

  • 主版本号(major_version): 后2字节用于表示主版本号。

(2)Java的版本号是从45开始的。如果Class文件的版本号超过虚拟机版本,将被拒绝执行。

十六进制版本号十进制版本号编译器版本
0X003450JDK1.8
0X003350JDK1.7
0X003250JDK1.6
0X003149JDK1.5
0X003048JDK1.4
0X002F47JDK1.3
0X002E46JDK1.2


5.常量池

这里写图片描述

(1)紧接着魔数与版本号之后的是常量池入口,即class文件的资源从库,它的特点如下:

  • Class文件结构中与其它项目关联最多的数据类型

  • 占用Class文件空间最大的数据项目之一

  • 在文件中第一个出现的表类型数据项目。

(2) 常量池之中主要存放两大类常量:

  • 字面量: 就是常量,如文本字符串、被声明为final的常量值等

  • 符号引用: ,包括类和接口的权限定名、字段的名称和描述符、方法的名称和描述符

  • 直接引用可以是直接指向引用目标的指针、相对偏移量或者是一个能够间接定位到目标的句柄。直接引用是和虚拟机的内存布局有关的,同一个符号引用在不同的虚拟机上翻译的直接引用一般是不同的。如果有了直接引用,那么引用的目标必定是存在内存中的。

(3)常量池又分为两种

  • constant_pool_count:占2字节,本例为0x0016,转化为十进制为22,即说明常量池中有22个常量(只有常量池的计数是从1开始的,其它集合类型均从0开始),索引值为1~22。第0项常量具有特殊意义,如果某些指向常量池索引值的数据在特定情况下需要表达“不引用任何一个常量池项目”的含义,这种情况可以将索引值置为0来表示

  • constant_pool:表类型数据集合,即常量池中每一项常量都是一个表,共有14种(JDK1.7前只有11种)结构各不相同的表结构数据。这14种表都有一个共同的特点,即均由一个u1类型的标志位开始,可以通过这个标志位来判断这个常量属于哪种常量类型,常量类型及其数据结构

通过javap -verbose TestClass 即可得到所有常量池中的常量,如图(部分截图)

这里写图片描述

6.访问标志
这里写图片描述

(1) 常量池之后的数据结构是访问标志(access_flags),用于识别一些类或接口层次的访问信息,主要包括:

  • 这个Class是类还是接口

  • 是否定义public

  • 是否定义abstract类型

  • 如果是类的话是否被声明为final等

具体的标志位见下图

这里写图片描述

7.类索引、父类索引和接口索引集合

这里写图片描述

(1)这三项数据主要用于确定这个类的继承关系,类索引(this_class)和父类索引(super_class)都是一个u2类型的数据,而接口索引(interface)集合是一组u2类型的数据。

(2)索引的含义

  • 类索引(this_class),用于确定这个类的全限定名,占2字节

  • 父类索引(super_class),用于确定这个类父类的全限定名(Java语言不允许多重继承,故父类索引只有一个。除了java.lang.Object类之外所有类都有父类,故除了java.lang.Object类之外,所有类该字段值都不为0),占2字节

  • 接口索引计数器(interfaces_count),占2字节。如果该类没有实现任何接口,则该计数器值为0,并且后面的接口的索引集合将不占用任何字节,

  • 接口索引集合(interfaces),一组u2类型数据的集合。用来描述这个类实现了哪些接口,这些被实现的接口将按implements语句(如果该类本身为接口,则为extends语句)后的接口顺序从左至右排列在接口的索引集合中

8.字段表集合

这里写图片描述

(1)fields_count:字段表计数器,即字段表集合中的字段表数据个数,占2字节。本测试类其值为0x0001,即只有一个字段表数据,也就是测试类中只包含一个变量(不算方法内部变量)

(2)fields:字段表集合,一组字段表类型数据的集合。字段表用于描述接口或类中声明的变量,包括类级别(static)和实例级别变量,不包括在方法内部声明的变量

9.方法表集合

(1) methods_count:方法表计数器,即方法表集合中的方法表数据个数。占2字节,其值为0x0002,即测试类中有2个方法

(2)methods:方法表集合,一组方法表类型数据的集合。方法表结构和字段表结构一样:

10.属性表集合

这里写图片描述

分析:

  • 起始2位为0x0001,说明有一个类属性。

  • 接下来2位为属性的名称,0x0010,指向常量池中第16个常量:SourceFile。

  • 接下来4位为0x00000002,说明属性体长度为2字节。

  • 最后2个字节为0x0011,指向常量池中第27个常量:TestClass.java,即这个Class文件的源码文件名为TestClass.java



本人才疏学浅,若有错,请指出
谢谢!

文章知识点与官方知识档案匹配,可进一步学习相关知识
Java技能树类和接口类和面向对象106559 人正在系统学习中

与[转帖]【JVM】类文件结构相似的内容:

[转帖]【JVM】类文件结构

Class文件的定义 一组以8字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑排列在class文件中,中间没有任何分隔符,这使得class文件中存储的内容几乎是全部程序运行的程序。 注:Java虚拟机规范规定,Class文件格式采用类似C语言结构体的伪结构来存储数据,这种结构只有两种数据类型:

[转帖]JVM 虚拟机(整体架构、类文件结构)我来了~~~

JVM 虚拟机(整体架构、类文件结构)我来了~~~ 虚拟机 1.1 发展历程 1.1.1 java 往事 ​ Java 诞生在一群懒惰、急躁而傲慢的程序天才之中。 ​ 1990 年 12 月,Sun 的工程师 Patrick Naughton 被当时糟糕的 Sun C++ 工具折磨的快疯了。他大声抱

[转帖]【JVM】字节码执行引擎

引入 class文件就是字节码文件,是由虚拟机执行的文件。也就是java语言和C & C++语言的区别就是,整个编译执行过程多了一个虚拟机这一步。这个在 类文件结构 中已经解释。上一节讲了虚拟机是如何加载一个class的,这一节就讲解虚拟机是如何执行class文件的。 运行时栈帧结构 1.定义 栈是

【转帖】3.JVM内存结构概述

目录 1.JVM内存结构 1.JVM内存结构 在JVM系列的第一篇文章中已经给出了JVM内存结构的简图,下面是JVM内存结构更加详细的图。 同样,JVM的内存结构可以分为上中下3层。 上层主要是类加载子系统,负责将字节码文件加载到内存中。 类加载又分为具体的三个环节,加载(loading)、链接(l

[转帖]JVM类加载机制

概述 虚拟机把描述类的数据从class文件加载到内存,并对数据进行校验,转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。 类的加载指的是将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创建一个java.lang.Cl

[转帖]【JVM】类加载机制

什么是类的加载 将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创建一个java.lang.Class对象,用来封装类在方法区内的数据结构。类的加载的最终产品是位于堆区中的Class对象,Class对象封装了类在方法区内的数据结构,并且向Java程序员提供

[转帖]【JVM】JVM概述

1.JVM定义 JVM 是Java Virtual Machine(JVM )的缩写,Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令进行执行,这样实现了Java“一次编译,到处运行”。 2.JVM组成 JVM由三大部分组成:类加载器(ClassLoader subsystem),执

[转帖]jvm crash when overwritten running jar

https://www.jianshu.com/p/bf0a051e4c63 现象 策划热更完配置表后 jvm直接就crash了(开发机linux) crash日志 日志分析 从crash日志看是reload配置表 使用Reflections扫描配置类 最终读取jar包 java.util.zip.

[转帖]JVM调优常用命令(jstat、jmap、jstack)

原文:https://www.cnblogs.com/ityouknow/p/5714703.html 一、jstat jstat(JVM statistics Monitoring)是用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据。 命令

【转帖】8.JVM双亲委派机制(面试常问)

目录 1.什么是双亲委派机制?2.双亲委派机制的优势3.沙箱安全机制 1.什么是双亲委派机制? 双亲委派机制工作原理:(面试) 1.如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行。 2.如果父类的加载器还存在其父类加载器,则进一步向上委托,依次递归,请