跳转至

31 JVM 相关的常见面试问题汇总:运筹策帷帐之中,决胜于千里之外

面试和笔试的要点其实差不多,基础知识和实战经验都是最重要的关注点(当然,面试时的态度和眼缘也很重要)。

实际面试时,因为时间有限,不可能所有问题都问一遍,一般是根据简历上涉及的内容,抽一部分话题来聊一聊。看看面试者的经验、态度,以及面对一层层深入问题时的处理思路。借此了解面试者的技术水平,对深度、广度,以及思考和解决问题的能力。

常见的面试套路是什么呢?

  • XXX 是什么?
  • 实现原理是什么?
  • 为什么这样实现?
  • 如果让你实现你会怎么做?
  • 分析下你的实现有什么优缺点?
  • 有哪些需要改进的地方?

下面总结一些比较常见的面试题,供大家参考。针对这些问题,大家可以给自己打一个分。

  • 0 分:不清楚相关知识。
  • 30 分:有一点印象,知道一些名词。
  • 60 分:知道一些概念以及含义,了解功能和常见用途。
  • 80 分:能在参考答案的基础上进行补充。
  • 100 分:发现参考答案的问题。

下面我们来看看 JVM 相关面试问题。

1. 什么是 JVM?

JVM 全称是 Java Virtual Machine,中文称为 Java 虚拟机。

JVM 是 Java 程序运行的底层平台,与 Java 支持库一起构成了 Java 程序的执行环境。

分为 JVM 规范和 JVM 实现两个部分。简单来说,Java 虚拟机就是指能执行标准 Java 字节码的虚拟计算机。

1.1 请问 JDK 与 JVM 有什么区别?

现在的 JDK、JRE 和 JVM 一般是整套出现的。

  • JDK = JRE + 开发调试诊断工具
  • JRE = JVM + Java 标准库

1.2 你认识哪些 JVM 厂商?

常见的 JDK 厂商包括:

  • Oracle 公司,包括 Hotspot 虚拟机、GraalVM,分为 OpenJDK 和 OracleJDK 两种版本
  • IBM 公司,J9 虚拟机,用在 IBM 的产品套件中
  • Azul Systems 公司,高性能的 Zing 和开源的 Zulu
  • 阿里巴巴,Dragonwell 是阿里开发的 OpenJDK 定制版
  • 亚马逊,Corretto OpenJDK
  • Red Hat 公司的 OpenJDK
  • Adopt OpenJDK
  • 此外,还有一些开源和试验性质的 JVM 实现,比如 Go.JVM

1.3 OracleJDK 与 OpenJDK 有什么区别?

各种版本的 JDK 一般来说都会符合 Java 虚拟机规范。 两者的区别一般来说包括:

  • 两种 JDK 提供的工具套件略有差别,比如 jmc 等有版权的工具。
  • 某些协议或配置不一样,比如美国限制出口的加密算法。
  • 其他细微差别,比如 JRE 中某些私有的 API 不一样。

1.4 开发中使用哪个版本的 JDK?生产环境呢?为什么这么选?

有一说一,选择哪个版本需要考虑研发团队的具体情况:比如机器的操作系统、团队成员的掌握情况、兼顾遗留项目等等。

当前 Java 最受欢迎的长期维护版本是 Java 8 和 Java 11。

  • Java 8 是经典 LTS 版本,性能优秀,系统稳定,良好支持各种 CPU 架构和操作系统平台。
  • Java 11 是新的长期支持版,性能更强,支持更多新特性,而且经过几年的维护已经很稳定。

有的企业在开发环境使用 OracleJDK,在生产环境使用 OpenJDK。也有的企业恰好相反,在开发环境使用 OpenJDK,在生产环境使用 OracleJDK。也有的公司使用同样的打包版本。开发和部署时只要进行过测试就没问题。一般来说,测试环境、预上线环境的 JDK 配置需要和生产环境一致。

2. 什么是 Java 字节码?

Java 中的字节码,是值 Java 源代码编译后的中间代码格式,一般称为字节码文件。

2.1 字节码文件中包含哪些内容?

字节码文件中,一般包含以下部分:

  • 版本号信息
  • 静态常量池(符号常量)
  • 类相关的信息
  • 字段相关的信息
  • 方法相关的信息
  • 调试相关的信息

可以说,大部分信息都是通过常量池中的符号常量来表述的。

2.2 什么是常量? 常量是指不变的量,字母 'K' 或者数字 1024 在 UTF-8 编码中对应到对应的二进制格式都是不变的。同样地,字符串在 Java 中的二进制表示也是不变的, 比如 "KK"

在 Java 中需要注意的是,final 关键字修饰的字段和变量,表示最终变量,只能赋值 1 次,不允许再次修改,由编译器和执行引擎共同保证。

2.3 你怎么理解常量池?

在 Java 中,常量池包括两层含义:

  • 静态常量池,class 文件中的一个部分,里面保存的是类相关的各种符号常量。
  • 运行时常量池,其内容主要由静态常量池解析得到,但也可以由程序添加。

3. JVM 的运行时数据区有哪些?

根据 JVM 规范,标准的 JVM 运行时数据区包括以下部分:

  • 程序计数器
  • Java 虚拟机栈
  • 堆内存
  • 方法区
  • 运行时常量池
  • 本地方法栈

具体的 JVM 实现可根据实际情况进行优化或者合并,满足规范的要求即可。

3.1 什么是堆内存? 堆内存是指由程序代码自由分配的内存,与栈内存作区分

在 Java 中,堆内存主要用于分配对象的存储空间,只要拿到对象引用,所有线程都可以访问堆内存。

3.2 堆内存包括哪些部分?

以 Hotspot 为例,堆内存(HEAP)主要由 GC 模块进行分配和管理,可分为以下部分:

  • 新生代
  • 存活区
  • 老年代

其中,新生代和存活区一般称为年轻代。

3.3 什么是非堆内存?

除堆内存之外,JVM 的内存池还包括非堆(NON_HEAP),对应于 JVM 规范中的方法区,常量池等部分:

  • MetaSpace
  • CodeCache
  • Compressed Class Space

4. 什么是内存溢出?

内存溢出(OOM)是指可用内存不足。

程序运行需要使用的内存超出最大可用值,如果不进行处理就会影响到其他进程,所以现在操作系统的处理办法是:只要超出立即报错,比如抛出“内存溢出错误”。

就像杯子装不下,满了要溢出来一样,比如一个杯子只有 500ml 的容量,却倒进去 600ml,于是水就溢出造成破坏。

4.1 什么是内存泄漏? 内存泄漏(Memory Leak)是指本来无用的对象却继续占用内存,没有再恰当的时机释放占用的内存

不使用的内存,却没有被释放,称为“内存泄漏”。也就是该释放的没释放,该回收的没回收。

比较典型的场景是:每一个请求进来,或者每一次操作处理,都分配了内存,却有一部分不能回收(或未释放),那么随着处理的请求越来越多,内存泄漏也就越来越严重。

在 Java 中一般是指无用的对象却因为错误的引用关系,不能被 GC 回收清理。

4.2 两者有什么关系? 如果存在严重的内存泄漏问题,随着时间的推移,则必然会引起内存溢出

内存泄漏一般是资源管理问题和程序 Bug,内存溢出则是内存空间不足和内存泄漏的最终结果。

5. 给定一个具体的类,请分析对象的内存占用

public class MyOrder{
  private long orderId;
  private long userId;
  private byte state;
  private long createMillis;
}

一般来说,MyOrder 类的每个对象会占用 40 个字节。

5.1 怎么计算出来的?

计算方式为:

  • 对象头占用 12 字节。
  • 每个 long 类型的字段占用 8 字节,3 个 long 字段占用 24 字节。
  • byte 字段占用 1 个字节。
  • 以上合计 37 字节,加上以 8 字节对齐,则实际占用 40 个字节。

5.2 对象头中包含哪些部分?

对象头中一般包含两个部分:

  • 标记字,占用一个机器字,也就是 8 字节。
  • 类型指针,占用一个机器字,也就是 8 个字节。
  • 如果堆内存小于 32GB,JVM 默认会开启指针压缩,则只占用 4 个字节。

所以前面的计算中,对象头占用 12 字节。如果是数组,对象头中还会多出一个部分:

  • 数组长度,int 值,占用 4 字节。

6. 常用的 JVM 启动参数有哪些?

截止目前(2020 年 3 月),JVM 可配置参数已经达到 1000 多个,其中 GC 和内存配置相关的 JVM 参数就有 600 多个。但在绝大部分业务场景下,常用的 JVM 配置参数也就 10 来个。

例如:

# JVM 启动参数不换行
# 设置堆内存
-Xmx4g -Xms4g 
# 指定 GC 算法
-XX:+UseG1GC -XX:MaxGCPauseMillis=50 
# 指定 GC 并行线程数
-XX:ParallelGCThreads=4 
# 打印 GC 日志
-XX:+PrintGCDetails -XX:+PrintGCDateStamps 
# 指定 GC 日志文件
-Xloggc:gc.log 
# 指定 Meta 区的最大值
-XX:MaxMetaspaceSize=2g 
# 设置单个线程栈的大小
-Xss1m 
# 指定堆内存溢出时自动进行 Dump
-XX:+HeapDumpOnOutOfMemoryError 
-XX:HeapDumpPath=/usr/local/

此外,还有一些常用的属性配置:

# 指定默认的连接超时时间
-Dsun.net.client.defaultConnectTimeout=2000
-Dsun.net.client.defaultReadTimeout=2000
# 指定时区
-Duser.timezone=GMT+08 
# 设置默认的文件编码为 UTF-8
-Dfile.encoding=UTF-8 
# 指定随机数熵源(Entropy Source)
-Djava.security.egd=file:/dev/./urandom 

6.1 设置堆内存 XMX 应该考虑哪些因素? 需要根据系统的配置来确定,要给操作系统和 JVM 本身留下一定的剩余空间。推荐配置系统或容器里可用内存的 70~80% 最好

6.2 假设物理内存是 8G,设置多大堆内存比较合适?

比如说系统有 8G 物理内存,系统自己可能会用掉一点,大概还有 7.5G 可以用,那么建议配置 -Xmx6g

说明:7.5G*0.8=6G,如果知道系统里有明确使用堆外内存的地方,还需要进一步降低这个值。

6.3 -Xmx 设置的值与 JVM 进程所占用的内存有什么关系? JVM 总内存 = 栈 + 堆 + 非堆 + 堆外 + Native

6.4 怎样开启 GC 日志?

一般来说,JDK 8 及以下版本通过以下参数来开启 GC 日志:

-XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:gc.log

如果是在 JDK 9 及以上的版本,则格式略有不同:

-Xlog:gc*=info:file=gc.log:time:filecount=0

6.5 请指定使用 G1 垃圾收集器来启动 Hello 程序

java -XX:+UseG1GC

-Xms4g

-Xmx4g

-Xloggc:gc.log

-XX:+PrintGCDetails

-XX:+PrintGCDateStamps

Hello

7. Java 8 默认使用的垃圾收集器是什么?

Java 8 版本的 Hotspot JVM,默认情况下使用的是并行垃圾收集器(Parallel GC)。其他厂商提供的 JDK 8 基本上也默认使用并行垃圾收集器。

7.1 Java11 的默认垃圾收集器是什么? Java 9 之后,官方 JDK 默认使用的垃圾收集器是 G1。

7.2 常见的垃圾收集器有哪些? 常见的垃圾收集器包括:

  • 串行垃圾收集器:-XX:+UseSerialGC
  • 并行垃圾收集器:-XX:+UseParallelGC
  • CMS 垃圾收集器:-XX:+UseConcMarkSweepGC
  • G1 垃圾收集器:-XX:+UseG1GC

7.3 什么是串行垃圾收集? 就是只有单个 worker 线程来执行 GC 工作。

7.4 什么是并行垃圾收集? 并行垃圾收集,是指使用多个 GC worker 线程并行地执行垃圾收集,能充分利用多核 CPU 的能力,缩短垃圾收集的暂停时间。

除了单线程的 GC,其他的垃圾收集器,比如 PS、CMS、G1 等新的垃圾收集器都使用了多个线程来并行执行 GC 工作。

7.5 什么是并发垃圾收集器? 并发垃圾收集器,是指在应用程序在正常执行时,有一部分 GC 任务,由 GC 线程在应用线程一起并发执行。 例如 CMS/G1 的各种并发阶段。

7.6 什么是增量式垃圾收集? 首先,G1 的堆内存不再单纯划分为年轻代和老年代,而是划分为多个(通常是 2048 个)可以存放对象的小块堆区域(smaller heap regions)。

每个小块,可能一会被定义成 Eden 区,一会被指定为 Survivor 区或者 Old 区。 这样划分之后,使得 G1 不必每次都去回收整个堆空间,而是以增量的方式来进行处理:每次只处理一部分内存块,称为此次 GC 的回收集(collection set)。 下一次 GC 时在本次的基础上,再选定一定的区域来进行回收。增量式垃圾收集的好处是大大降低了单次 GC 暂停的时间。

7.7 什么是年轻代? 年轻代是分来垃圾收集算法中的一个概念,相对于老年代而言,年轻代一般包括:

  • 新生代,Eden 区。
  • 存活区,执行年轻代 GC 时,用存活区来保存活下来的对象。存活区也是年轻代的一部分,但一般有 2 个存活区,所以可以来回倒腾。

7.8 什么是 GC 停顿(GC pause)? 因为 GC 过程中,有一部分操作需要等所有应用线程都到达安全点,暂停之后才能执行,这时候就叫做 GC 停顿,或者叫做 GC 暂停。

7.9 GC 停顿与 STW 停顿有什么区别? 这两者一般可以认为就是同一个意思。

8. 如果 CPU 使用率突然飙升,你会怎么排查?

缺乏经验的话,针对当前问题,往往需要使用不同的工具来收集信息,例如: * 收集不同的指标(CPU、内存、磁盘 IO、网络等等) * 分析应用日志 * 分析 GC 日志 * 获取线程转储并分析 * 获取堆转储来进行分析

8.1 如果系统响应变慢,你会怎么排查? 一般根据 APM 监控来排查应用系统本身的问题,有时候也可以使用 Chrome 浏览器等工具来排查外部原因,比如网络问题。

8.2 系统性能一般怎么衡量? 可量化的 3 个性能指标:

  • 系统容量:比如硬件配置,设计容量;
  • 吞吐量:最直观的指标是 TPS;
  • 响应时间:也就是系统延迟,包括服务端延时和网络延迟。 这些指标。可以具体拓展到单机并发、总体并发、数据量、用户数、预算成本等等。

9. 使用过哪些 JVM 相关的工具?

这个问题请根据实际情况回答,比如 Linux 命令,或者 JDK 提供的工具等。

9.1 查看 JVM 进程号的命令是什么? 可以使用 ps -efjps -v 等等。

9.2 怎么查看剩余内存? 比如:free -mfree -htop 命令等等。

9.3 查看线程栈的工具是什么? 一般先使用 jps 命令,再使用 jstack -l

9.4 用什么工具来获取堆内存转储? 一般使用 jmap 工具来获取堆内存快照。

9.5 内存 Dump 时有哪些注意事项? 根据实际情况来看,获取内存快照可能会让系统暂停或阻塞一段时间,根据内存量决定。

使用 jmap 时,如果指定 live 参数,则会触发一次 Full GC,需要注意。

9.6 使用 JMAP 转储堆内存大致的参数怎么处理? 示例:

jmap -dump:format=b,file=3826.hprof 3826

9.7 为什么转储文件以 .hprof 结尾? JVM 有一个内置的分析器叫做 HPROF,堆内存转储文件的格式,最早就是这款工具定义的。

9.8 内存 Dump 完成之后,用什么工具来分析? 一般使用 Eclipse MAT 工具,或者 jhat 工具来处理。

9.9 如果忘记了使用什么参数你一般怎么处理? 上网搜索是比较笨的办法,但也是一种办法。

另外就是,各种 JDK 工具都支持 -h 选项来查看帮助信息,只要用得比较熟练,即使忘记了也很容易根据提示进行操作。

10. 开发性问题:你碰到过哪些 JVM 问题?

比如 GC 问题、内存泄漏问题、或者其他疑难杂症等等。然后可能还有一些后续的问题。例如: * 你遇到过的印象最深的 JVM 问题是什么? * 这个问题是怎么分析和解决的? * 这个过程中有哪些值得分享的经验? 此问题为开放性问题,请根据自身情况进行回答,可以把自己思考的答案发到本专栏的微信群里,我们会逐个进行分析点评。 ```