Java Virtual Machine ,Java 程序的运行环境(Java 二进制字节码的运行环境)。
常见的 JVM:
来源维基百科:https://en.wikipedia.org/wiki/Comparison_of_Java_virtual_machines
学习路线:
参考资料:https://www.javainterviewpoint.com/java-virtual-machine-architecture-in-java/
程序计数器
Program Counter Register 程序计数器(是通过寄存器实现的),用于保存JVM中下一条所要执行的指令的地址。
PC 寄存器用来存储指向下一条指令的地址,即将要执行的指令代码。由执行引擎读取下一条指令。
左边是二进制字节码,右边是Java编译后的代码,程序计数器就是用于记住下一条jvm指令的执行地址,比如现在是“0”,那他就会记住“3”,因为“3”在“0”的下面,而JVM会将指令 交给 解释器,解释器再将转为 机器码,交于CPU执行。
特点:
- 是线程私有的:
- CPU会为每个线程分配时间片,当当前线程的时间片使用完以后,CPU就会去执行另一个线程中的代码
- 程序计数器是每个线程所私有的,当另一个线程的时间片用完,又返回来执行当前线程的代码时,通过程序计数器可以知道应该执行哪一句指令
- 不会存在内存溢出
虚拟机栈
Java Virtual Machine Stacks (Java 虚拟机栈),栈:先入后出
- 每个线程运行需要的内存空间,称为虚拟机栈
- 每个栈由多个栈帧组成,对应着每次方法调用时所占用的内存空间(参数、局部变量、返回地址)
- 每个线程只能有一个活动栈帧,对应当前正在执行的那个方法
IDEA中的虚拟机栈:
常见问题
- 垃圾回收是否涉及栈内存?
不需要。因为虚拟机栈中是由一个个栈帧组成的,在方法执行完毕后,对应的栈帧就会被弹出栈。所以无需通过垃圾回收机制去回收内存。
- 栈内存分配越大越好吗?
不是。因为物理内存是一定的,栈内存越大,可以支持更多的递归调用,但是可执行的线程数就会越少。
使用
-Xss 可以设置栈内存大小,比如物理内存是100Mb,当栈内存为1Mb时,可以同时有100个线程,而当栈内存为2Mb时,最多同时只有50个线程了。
- 方法内的局部变量是否线程安全?
如果方法内部局部变量没有逃离方法的作用访问,它是线程安全的
如果是局部变量引用了对象,并逃离方法的范围,需要考虑线程安全问题
public class main1 { public static void main(String[] args) { } //下面各个方法会不会造成线程安全问题? //不会 public static void m1() { StringBuilder sb = new StringBuilder(); sb.append(1); sb.append(2); sb.append(3); System.out.println(sb.toString()); } //会,可能会有其他线程使用这个对象 public static void m2(StringBuilder sb) { sb.append(1); sb.append(2); sb.append(3); System.out.println(sb.toString()); } //会,其他线程可能会拿到这个线程的引用 public static StringBuilder m3() { StringBuilder sb = new StringBuilder(); sb.append(1); sb.append(2); sb.append(3); return sb; } }
栈内存溢出
导致栈内存溢出的情况:
- 栈帧过多导致栈内存溢出
- 栈帧过大导致栈内存溢出
线程运行诊断
Linux环境下运行某些程序的时候,可能导致CPU的占用过高,使用
这样就知道那个线程占用过多的CPU了,进一步定位到问题代码的源码行数
还可以展示出死锁的信息
本地方法栈
Native Method Stacks
一些带有native关键字的方法就是需要JAVA去调用本地的C或者C++方法,因为JAVA有时候没法直接和操作系统底层交互,所以需要用到本地方法。
堆
Heap (堆),通过new关键字创建的对象都会使用堆内存
- 它是线程共享的,堆中对象都需要考虑线程安全的问题
- 有垃圾回收机制
堆内存溢出
设置堆空间大小:
/** * 演示堆内存溢出 java.lang.OutOfMemoryError: Java heap space * -Xmx8m ,最大堆空间的jvm虚拟机参数,默认是4g */ public class main1 { public static void main(String[] args) { int i = 0; try { ArrayList<String> list = new ArrayList<>();// new 一个list 存入堆中 String a = "hello"; while (true) { list.add(a);// 不断地向list 中添加 a a = a + a; i++; } } catch (Throwable e) {// list 使用结束,被jc 垃圾回收 e.printStackTrace(); System.out.println(i); } } }
堆内存诊断
jps 工具
查看当前系统中有哪些 java 进程
jmap 工具
查看堆内存占用情况
jconsole 工具
图形界面的,多功能的监测工具,可以连续监测
jvisualvm 工具
可视化的展示虚拟机的内容
方法区
方法区(Method Area) 是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息(比如class文件)、常量、静态变量、即时编译器编译后的代码等数据。(什么是类信息:类版本号、方法、接口。)
官方对于方法区的定义:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html
- 1.6是永久代实现,使用的堆内存
- 1.8是元空间实现,使用的本地内存
方法区内存溢出
- 1.8以前会导致永久代内存溢出
java.lang.OutOfMemoryError: PermGen space - -XX:MaxPermSize=8m
- 1.8以后会导致元空间内存溢出
java.lang.OutOfMemoryError: Metaspace - -XX:MaxMetaspaceSize=8m
/** * 演示元空间内存溢出 java.lang.OutOfMemoryError: Metaspace * -XX:MaxMetaspaceSize=8m */ public class Demo1_8 extends ClassLoader { // 可以用来加载类的二进制字节码 public static void main(String[] args) { int j = 0; try { Demo1_8 test = new Demo1_8(); for (int i = 0; i < 10000; i++, j++) { // ClassWriter 作用是生成类的二进制字节码 ClassWriter cw = new ClassWriter(0); // 版本号, public, 类名, 包名, 父类, 接口 cw.visit(Opcodes.V1_8, Opcodes.ACC_PUBLIC, "Class" + i, null, "java/lang/Object", null); // 返回 byte[] byte[] code = cw.toByteArray(); // 执行了类的加载 test.defineClass("Class" + i, code, 0, code.length); // Class 对象 } } finally { System.out.println(j); } } }
运行时常量池
常量池:就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
运行时常量池:常量池是 *.class 文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
通过使用 javap 命令反编译 class 文件后,可以得到类的一些信息:
常量池:
HelloWorld 方法:
系统会在HelloWorld方法反编译后得到的指令,去常量池中查找,比如第0条指令,后面是
#2 ,则会在常量池中寻找,而常量池中的#2 后面还有#6.#20 也会依次寻找#6 和#20 。
StringTable
- 常量池中的字符串仅是符号,第一次用到时才变为对象
- 利用串池的机制,来避免重复创建字符串对象
- 字符串变量拼接的原理是 StringBuilder(1.8)
- 字符串常量拼接的原理是编译期优化
- 可以使用 intern 方法,主动将串池中还没有的字符串对象放入串池
- 1.8 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有则放入串池, 会把串池中的对象返回
- 1.6 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有会把此对象复制一份,放入串池,会把串池中的对象返回
常量池与串池的关系
常量池中的信息,都会被加载到运行时常量池中,这时的 a b ab 都还是常量池中的符号(没有成为java对象),只有在被用到的时候(类似懒加载机制),并且**串池(hashtable结构 不可扩容)**中不存在,才会被存入串池中。
String s1 = "a"; String s2 = "b"; String s3 = "ab";
所以当这三行代码都执行了之后,**串池(StringTable)**中的数据应该为:
字符串变量拼接(1.8)
字符串变量之间的拼接,底层使用的StringBuilder类
String s4 = s1 + s2; // new StringBuilder().append("a").append("b").toString() new String("ab") System.out.println(s3 == s4); // false
StringBuilder类的toString方法底层使用的是
编译期优化
String s5 = "a" + "b"; // javac 在编译期间的优化,结果已经在编译期确定为ab System.out.println(s3 == s5); // ture
这里也能看到 s3 和 s5 指向的都是
字符串加载延迟
System.out.println(); // 字符串个数 2256 System.out.print("1"); // 字符串个数 2257 System.out.print("2"); // 字符串个数 2258 System.out.print("3"); // 字符串个数 2259 System.out.print("4"); // 字符串个数 2260 System.out.print("1"); // 字符串个数 2260 System.out.print("2"); // 字符串个数 2260 System.out.print("3"); // 字符串个数 2260 System.out.print("4"); // 字符串个数 2260
字符串只有在被执行的时候,才会进入串池,如果串池中已经有了,就不会新添加。
intern方法(1.8)
将字符串对象尝试放入串池,如果有则并不会放入,如果没有则放入串池,会把串池中的对象返回。
- 如果串池中没有这个字符串,将字符串对象放入串池,也就是说,放入的和返回的是同一个对象
- 如果串池中有这个字符串,就直接返回串池中的对象,准备放入串池的对象和返回的不是同一个对象
String x = "ab"; String s = new String("a") + new String("b"); // 串池:ab, a, b // 堆:new String("a"), new String("b"), new String("ab") String s2 = s.intern(); // 因为ab已经在串池了,s对象放入串池失败,返回的s2是串池中的对象 System.out.println(s2 == x); // true System.out.println(s == x); // false // 如果没有x变量,则 "ab" = s = s2
intern方法(1.6)
将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有会把此对象复制一份,放入串池,会把串池中的对象返回。
复制的对象和原对象不是同一个对象
- 如果串池中没有这个字符串,将字符串对象复制一份,复制的对象和原来的对象内存地址值是不一样的,放入的和返回的不是同一个对象
- 如果串池中有这个字符串,就直接返回串池中的对象,准备放入串池的对象和返回的不是同一个对象
String s = new String("a") + new String("b"); // 串池:a, b // 堆:new String("a"), new String("b"), new String("ab") String s2 = s.intern(); // s 拷贝一份,放入串池 String x = "ab"; // x 拿到的是串池中的对象 System.out.println(s2 == x); // false System.out.println(s == x); // false // 如果是jdk1.8,则不会拷贝, s = s2 = x
StringTable位置
- JDK1.6,StringTable是属于常量池的一部分。
- JDK1.8,StringTable是放在堆中的。
StringTable垃圾回收
StringTable在内存紧张时,会触发垃圾回收,回收那些没有被引用的字符串。
StringTable性能调优
串池的底层用的是HashTable,数组+链表的数据结构
使用
StringTable statistics: Number of buckets : 60013 = 480104 bytes, avg 8.000 Number of entries : 481491 = 11555784 bytes, avg 24.000 Number of literals : 481491 = 29750584 bytes, avg 61.788 Total footprint : = 41786472 bytes Average bucket size : 8.023 Variance of bucket size : 8.084 Std. dev. of bucket size: 2.843 Maximum bucket size : 23
可以看到,默认的数组大小为 60013 个,串池中的字符串的数量为 481491 个。
如果系统中字符串用到的比较多的话,可以适当的将串池的数组长度调大:
-XX:StringTableSize=桶个数
桶个数应在1009以上。
当桶的个数变多时,Hash碰撞的几率就变小,链表的长度会变短,因为HashTable中的值是不重复的,链表变短后,校验字符串是否重复的时间会变短,从而提升效率。
可以通过intern方法减少重复入池,保证相同的字符串在StringTable中只存储一份:
List<String> address = new ArrayList<>(); for (int i = 0; i < 10; i++) { try (BufferedReader reader = new BufferedReader(/* 此处读取文件... */)) { String line; while (true) { line = reader.readLine(); if (line == null) { break; } address.add(line/*.intern()*/); } } }
在这种情况下使用intern方法,占用内存的大小会比不使用intern方法占用内存的大小 小得多。
追溯到readLine底层,使用的是new String来构建字符串的,所以直接是存放在堆内存中,如果不使用intern方法,则所有的字符串对象都在堆内存中,而使用后剩余9次循环添加到集合的对象则是串池中的对象,理论上节约了十分之九的内存。
直接内存
Direct Memory
- 常见于 NIO 操作时,用于数据缓冲区
- 分配回收成本较高,但读写性能高
- 不受 JVM 内存回收管理
普通的IO:
读入文件会先将文件放入系统的内存,再将文件放入Java的堆内存,Java才能读取,比较浪费时间、浪费性能。
NIO:
开辟一块系统和Java都能访问到的内存区域,无需将文件再次缓冲到Java的堆内存当中,提高效率。
直接内存也会导致内存溢出,比如运行下面的代码:
static int _100Mb = 1024 * 1024 * 100; public static void main(String[] args) { List<ByteBuffer> list = new ArrayList<>(); int i = 0; try { while (true) { ByteBuffer byteBuffer = ByteBuffer.allocateDirect(_100Mb); list.add(byteBuffer); i++; } } finally { System.out.println(i); } }
可以看到下面的结果:
分配和回收原理
直接内存的回收不是通过JVM的垃圾回收来释放的,而是通过
import sun.misc.Unsafe; Unsafe unsafe = getUnsafe(); // Java内部使用的对象,可以通过反射获取对象 // 分配内存 1Gb = 1024 * 1024 * 1024 long base = unsafe.allocateMemory(_1Gb); unsafe.setMemory(base, 1024 * 1024 * 1024, (byte) 0); // 释放内存 unsafe.freeMemory(base);
而NIO中的ByteBuffer类就是用到了该原理:
- 在DirectByteBuffer类(ByteBuffer的子类)的构造器中,使用了
unsafe.allocateMemory(size) 来获取内存空间 - ByteBuffer的实现类内部,使用了Cleaner(虚引用类型)对象来监测ByteBuffer对象是否被回收
- 如果被回收,则会触发Cleaner对象的
clean() 方法 clean() 方法又会调用创建Cleaner时传入的Deallocator对象(该对象实现了Runnable接口,是一个单独的线程,用来调用unsafe.freeMemory(address) 方法)
Demo:
ByteBuffer byteBuffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024); System.out.println("分配完毕..."); System.out.println("开始释放..."); byteBuffer = null; System.gc(); // 显式的垃圾回收,把byteBuffer对象回收掉,然后会自动触发Cleaner的clean()方法 System.in.read();
禁用显式回收对直接内存的影响
可以使用
但是如果禁用掉,上面的Demo中的ByteBuffer对象则会长时间存在,程序占用的1Gb的直接内存也不会释放。
此时,建议使用Unsafe类的