《面试必问之jvm与性能优化》(二)

《面试必问之jvm与性能优化》(二)

运行时数据区域包括方法区、虚拟机栈、本地方法栈、堆、程序计数器。其中方法区和堆是所有线程共享的数据区,其他的是线程隔离的数据区。

1.1、程序计数器

程序计数器是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器,确定下一条需要执行的字节码指令。java的多线程是通 过线程轮流切换并分配处理器执行时间的方式来实现的,在任何确定的一个时刻,一个处理器只会执行一条线程中的指令。为了线程切换之后能恢复到正确的执行位 置,每个线程都需要有一个独立的程序计数器,各个线程之间的计数器互不影响。如果线程正在执行的是一个java方法,则计数器记录的是正在执行的虚拟机字 节码指令的地址,如果正在执行的是native方法,则计数器值为空。

1.2、java虚拟机栈

java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是java方法执行的内存模型:每个方法被执行的时候都会创建一个栈帧用 于存在局部变量表、操作栈、动态链接、方法出口等信息。通过所说的栈是局部变量表,即与对象内存分配关系最密切的内存区域。局部变量表的内存空间在编译期 间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是确定的,在运行期不会改变。

java虚拟机栈有两种异常:如果线程请求的栈深度大于虚拟机所允许的深度,则抛弃StackOverflowError异常;如果虚拟机栈可以动态扩展的,当扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。

1.3、本地方法栈

本地方法栈与虚拟机栈所发挥的作用是相似的,区别在于虚拟机栈为虚拟机执行java方法的服务,本地方法栈则是为虚拟机使用到native方法服务。

1.4、java堆

java堆是虚拟机所管理的内存中最大的一块,是虚拟机启动是创建的能被所有线程共享的一块内存区域。java堆的唯一目的就是存放对象实例,几乎 所有的对象实例和数组都在这里分配内存(随着JTI编译器的发展,在栈上也有可能分配)。java堆是垃圾收集器管理的主要区域,在物理上可以使不连续的 内存空间,但在逻辑上是联系的。

如果再堆中没有内存完成实例的分配,并且堆也无法在扩展的时候,将会抛出OutOfMemoryError异常。

1.5、方法区

方法区也是线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。这块区域很少进行垃圾回收,甚 至可以不实现垃圾收集,主要是针对常量池的回收和对类型的卸载。当方法区无法分配内存的时候,将抛出OutOfMemoryError异常。

Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池,用于存放编译期的各种字面量和符号引用。并非预置入 Class文件中的常量才能进入常量池,运行期间也可能将新的常量放入池中,开发中用的比较多的是String类的intern()方法。

2、例子解析

假设这句代码出现在方法体中,那么Object obj将会反映到java栈的局部变量表中,作为一个reference类型数据出现,new Object()将会反映到java堆中,形成一块存储了Object类型的实例数据的结构化内存,此对象类型数据,如对象类型、父类、实现的接口、方法 等信息存储在方法区。

2. Java 中会存在内存泄漏吗,简述一下?

理论上Java因为有垃圾回收机制(GC)不会存在内存泄露问题(这也是Java被广泛使用于服务器端编程的一个重要原因);然而在实际开发中,可能会存在无用但可达的对象,这些对象不能被GC回收,因此也会导致内存泄露的发生。例如Hibernate的Session(一级缓存)中的对象属于持久态,垃圾回收器是不会回收这些对象的,然而这些对象中可能存在无用的垃圾对象,如果不及时关闭(close)或清空(flush)一级缓存就可能导致内存泄露。

3. Java 类加载过程?

在Java中,类装载器把一个类装入Java虚拟机中,要经过三个步骤来完成:装载、链接和初始化,其中链接又可以分成校验、准备、解析

装载:查找和导入类或接口的二进制数据;

链接:执行下面的校验、准备和解析步骤,其中解析步骤是可以选择的;

校验:检查导入类或接口的二进制数据的正确性;

准备:给类的静态变量分配并初始化存储空间;

解析:将符号引用转成直接引用;

初始化:激活类的静态变量,初始化Java代码和静态Java代码块

4. 什么是GC? 为什么要有 GC?

GC是垃圾收集的意思,内存处理是编程人员容易出现问题的地方,

忘记或者错误的内存回收会导致程序或系统的不稳定甚至崩溃,Java提供的GC功能可以自动监测对象是否超过作用域从而达到自动回收内存的目的,Java语言没有提供释放已分配内存的显示操作方法。Java程序员不用担心内存管理,因为垃圾收集器会自动进行管理。要请求垃圾收集,可以调用下面的方法之一:System.gc()或Runtime.getRuntime().gc(),但JVM可以屏蔽掉显示的垃圾回收调用。

垃圾回收可以有效的防止内存泄露,有效的使用可以使用的内存。垃圾回收器通常是作为一个单独的低优先级的线程运行,不可预知的情况下对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收,程序员不能实时的调用垃圾回收器对某个对象或所有对象进行垃圾回收。

在Java诞生初期,垃圾回收是Java最大的亮点之一,因为服务器端的编程需要有效的防止内存泄露问题,然而时过境迁,如今Java的垃圾回收机制已经成为被诟病的东西。移动智能终端用户通常觉得iOS的系统比Android系统有更好的用户体验,其中一个深层次的原因就在于Android系统中垃圾回收的不可预知性。

采用“分代式垃圾收集”。这种方法会跟Java对象的生命周期将堆内存划分为不同的区域,在垃圾收集过程中,可能会将对象移动到不同区域:

伊甸园(Eden):这是对象最初诞生的区域,并且对大多数对象来说,这里是它们唯一存在过的区域。

幸存者乐园(Survivor):从伊甸园幸存下来的对象会被挪到这里。

终身颐养园(Tenured):这是足够老的幸存对象的归宿。年轻代收集(Minor-GC)过程是不会触及这个地方的。当年轻代收集不能把对象放进终身颐养园时,就会触发一次完全收集(Major-GC),这里可能还会牵扯到压缩,以便为大对象腾出足够的空间。

与垃圾回收相关的JVM参数:

· -Xms / -Xmx —堆的初始大小 / 堆的最大大小

· -Xmn — 堆中年轻代的大小

补充:

Java是由C++发展来的。

它摈弃了C++中一些繁琐容易出错的东西。其中有一条就是这个GC。

写C/C++程序,程序员定义了一个变量,就是在内存中开辟了一段相应的空间来存值。内存再大也是有限的,所以当程序不再需要使用某个变量的时候,就需要释放这个内存空间资源,好让别的变量来用它。在C/C++中,释放无用变量内存空间的事情要由程序员自己来解决。就是说当程序员认为变量没用了,就应当写一条代码,释放它占用的内存。这样才能最大程度地避免内存泄露和资源浪费。

但是这样显然是非常繁琐的。程序比较大,变量多的时候往往程序员就忘记释放内存或者在不该释放的时候释放内存了。而且释放内存这种事情,从开发角度说,不应当是程序员所应当关注的。程序员所要做的应该是实现所需要的程序功能,而不是耗费大量精力在内存的分配释放上。

Java有了GC,就不需要程序员去人工释放内存空间。当Java虚拟机发觉内存资源紧张的时候,就会自动地去清理无用变量所占用的内存空间。当然,如果需要,程序员可以在Java程序中显式地使用System.gc()来强制进行一次立即的内存清理。

因为显式声明是做堆内存全扫描,也就是 Full GC,是需要停止所有的活动的(Stop The World Collection),你的应用能承受这个吗?而其显示调用System.gc()只是给虚拟机一个建议,不一定会执行,因为System.gc()在一个优先级很低的线程中执行。

5. 简述一下Java 垃圾回收机制?

**什么是垃圾回收机制:**在系统运行过程中,会产生一些无用的对象,这些对象占据着一定的内存,如果不对这些对象清理回收无用对象的内存,可能会导致内存的耗尽,所以垃圾回收机制回收的是内存。同时GC回收的是堆区和方法区的内存。

JVM回收特点:(stop-the-world)当要进行垃圾回收时候,不管何种GC算法,除了垃圾回收的线程之外其他任何线程都将停止运行。被中断的任务将会在垃圾回收完成后恢复进行。GC不同算法或是GC调优就是减少stop-the-world的时间。à(为何非要stop-the-world),就像是一个同学的聚会,地上有很多垃圾,你去打扫,边打扫边丢垃圾怎么都不可能打扫干净的哈。当在垃圾回收时候不暂停所有的程序,在垃圾回收时候有new一个新的对象B,此时对象A是可达B的,但是没有来及标记就把B当成无用的对象给清理掉了,这就会导致程序的运行会出现错误。

如何判断哪些对象需要回收呢:

**引用计数算法(java中不是使用此方法):**每个对象中添加一个引用计数器,当有别人引用它的时候,计数器就会加1,当别人不引用它的时候,计数器就会减1,当计数器为0的时候对象就可以当成垃圾。算法简单,但是最大问题就是在循环引用的时候不能够正确把对象当成垃圾。

**根搜索方法(这是后面垃圾搜集算法的基础):**这是JVM一般使用的算法,设立若干了根对象,当上述若干个跟对象对某一个对象都不可达的时候,这个对象就是无用的对象。对象所占的内存可以回收。

根搜索算法的基础上,现代虚拟机的实现当中,垃圾搜集的算法主要有三种,分别是标记-清除算法、复制算法、标记-整理算法。

**标记-消除算法:**当堆中的有效内存被耗尽的时候,就会停止整个系统,就会调用标记-消除算法,主要做两件事,1就是标记,2就是清除。然后让程序恢复。

标记:遍历所有GCroots把可达的对象标记为存活的对象。

清除:把未标记为存活的对象清楚掉。

缺点:

就是效率相对比较低。会导致stop-the-world时间过长。

因为无用的对象内存不是连续的因此清理后的内存也不是连续的,(会产生内存碎片)因此JVM还要维持一个空闲列表,增加一笔开销,同时在以后内存使用时候,去查找可用的内存这个效率也是很低的。

复制算法:(这个算法一般适合在新生代GC),将原有的内存分为两块,每次只适用其中的一块,在垃圾回收的时候,将一块正在使用的内存中存活(上述根搜索的算法)的对象复制到另一块没有使用的内存中,原来的那一块全部清除。与上述的标记-清除算法相比效率更高,但是不太适合使用在对象存活较多的情况下(如老年代)。

**缺点:**每次对整个半区内存回收,因此效率比上面的要高点,同时在分配内存的时候不需要考虑内存的碎片。按照顺序分配内存。简单高效。

但是最大的问题在于此算法在对象存活率非常低的时候使用,将可用内存分为两份,每次只使用一份这样极大浪费了内存。

注意(重要):现在的虚拟机使用复制算法来进行新生代的内存回收。因为在新生代中绝大多数的对象都是“朝生夕亡”,所以不需要将整个内存分为两个部分,而是分为三个部分,一块为Eden和两块较小的Survivor空间(比例->8:1:1)。每次使用Eden和其中的一块Survivor,垃圾回收时候将上述两块中存活的对象复制到另外一块Survivor上,同时清理上述Eden和Survivor。所以每次新生代就可以使用90%的内存。只有10%的内存是浪费的。(不能保证每次新生代都少于10%的对象存活,当在垃圾回收复制时候如果一块Survivor不够时候,需要老年代来分担,大对象直接进入老年代)

标记-整理算法:(老年代GC)在存活率较高的情况下,复制的算法效率相对比较低,同时还要考虑存活率可能为100%的极端情况,因此又不能把内存分为两部分的复制算法。

在上面标记-复制算法的基础之上,演变出了一个新的算法就是标记-整理算法。首先从GCroots开始标记所有可达的对象,标记为存活的对象。然后将存活的对象压缩到内存一端按照内存地址的次序依次排列,然后末端内存地址之后的所有内存都清除。

**总结:**将标记存活的对象按照内存地址顺序排列到内存另一端,末端内存地址之后的内存都会被清除。

**比较:**相比较于标记-清楚算法 (传统的),该算法可以解决内存碎片问题同时还可以解决复制算法部分内存不能利用的问题。但是标记-整理算法的效率也不是很高。

->上述算法都是根据根节点搜索算法来判断一个对象是不是需要回收,而支撑根节点搜索算法能够正常工作理论依据就是语法中变量作用域的相关内容。

三种算法比较:

**效率:**复制算法>标记-整理算法>标记-清除算法;

**内存整齐度:**复制算法=标记-整理算法>标记-清除算法

**内存利用率:**标记-整理算法=标记-清除算法>复制算法

分代收集算法:

现在使用的Java虚拟机并不是只是使用一种内存回收机制,而是分代收集的算法。就是将内存根据对象存活的周期划分为几块。一般是把堆分为新生代、和老年代。短命对象存放在新生代中,长命对象放在老年代中。

对于不同的代,采用不同的收集算法:

**新生代:**由于存活的对象相对比较少,因此可以采用复制算法该算法效率比较快。

**老年代:**由于存活的对象比较多哈,可以采用标记-清除算法或是标记-整理算法

(注意)新生态由于根据统计可能有98%对象存活时间很短因此将内存分为一块比较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。

上述是垃圾回收机制的算法,但是垃圾回收器才是垃圾回收的具体实现:

常见有五个垃圾回收器:

一:串行收集器:(Serial收集器)

该收集器最古老、稳定简单是一个单线程的收集器,(stop-the-world)可能会产生长时间的停顿. serial 收集器一定不能用于服务器端。这个收集器类型仅应用于单核CPU桌面电脑。

新生代和老年代都会使用serial收集器。新生代使用复制算法(内存分三块的那个复制算法)。老年代使用标记-整理算法。

二:并行收集器:(Parallel收集器)

parallel收集器使用多线程并行处理GC,因此更快。当有足够大的内存和大量芯数时,parallel收集器是有用的。它也被称为“吞吐量优先垃圾收集器。”

三:并行收集器:(Parallel Old 垃圾收集器)

相比于parallel收集器,他们的唯一区别就是在老年代所执行的GC算法的不同。它执行三个步骤:标记-汇总-压缩(mark – summary – compaction)。汇总步骤与清理的不同之处在于,其将依然幸存的对象分发到GC预先处理好的不同区域,算法相对清理来说略微复杂一点。

四:并行收集器:(CMS收集器)

(ConcurrentMark Sweep:并发标记清除)是一种以获取最短回收停顿时间为目标的收集器。适合应用在互联网站或者B/S系统的服务器上,这类应用尤其重视服务器的响应速度,希望系统停顿时间最短。

五:G1收集器

这个类型的垃圾收集算法是为了替代CMS 收集器而被创建的,因为CMS 收集器在长时间持续运行时会产生很多问题。

6. 如何判断一个对象是否存活?

在堆里面存放着Java世界中几乎所有的对象实例,垃圾收集器对堆内存进行回收前,都会先判断这些

对象之中哪些还“存活”着,哪些已经“死去”(即不可能在被任何途径使用的对象)。一共有两种算法:

引用计数算法

给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器

值就减1;任何时刻计数器为0的对象就是不可能再被使用的。

JVM里面并没有选用引用计数算法来管理内存,主要原因是它很难解决对象之间相互循环引用的问题。

可达性分析算法

通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为

引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。

7. 垃圾回收的优点和原理,并考虑 2 种回收机制?基本原理是什么?

Java 语言中一个显著的特点就是引入了垃圾回收机制,使c++程序员最头疼的内存管理 的问题迎刃而解,它使得Java 程序员在编写程序的时候不再需要考虑内存管理。由于 有个垃圾回收机制,Java 中的对象不再有"作用域"的概念,只有对象的引用才有"作用 域"。垃圾回收可以有效的防止内存泄露,有效的使用可以使用的内存。垃圾回收器通 常是作为一个单独的低级别的线程运行,不可预知的情况下对内存堆中已经死亡的或 者长时间没有使用的对象进行清楚和回收,程序员不能实时的调用垃圾回收器对某个 对象或所有对象进行垃圾回收。回收机制有分代复制垃圾回收和标记垃圾回收,增量 垃圾回收。

8. 深拷贝和浅拷贝?

浅拷贝被复制对象的所有变量都含有与原来的对象相同的值,而所有的对其他对象的引用仍然指向原来的对象。即对象的浅拷贝会对“主”对象进行拷贝,但不会复制主对象里面的对象。”里面的对象“会在原来的对象和它的副本之间共享。

简而言之,浅拷贝仅仅复制所考虑的对象,而不复制它所引用的对象。

深拷贝深拷贝是一个整个独立的对象拷贝,深拷贝会拷贝所有的属性,并拷贝属性指向的动态分配的内存。当对象和它所引用的对象一起拷贝时即发生深拷贝。深拷贝相比于浅拷贝速度较慢并且花销较大。

简而言之,深拷贝把要复制的对象所引用的对象都复制了一遍。

9. 什么是分布式垃圾回收(DGC)?它是如何工作的?

RMI 子系统实现基于引用计数的“分布式垃圾回收”(DGC),以便为远程服务器对象提供自动内存管理设施。

当客户机创建(序列化)远程引用时,会在服务器端 DGC 上调用 dirty()。当客户机完成远程引用后,它会调用对应的 clean() 方法。

针对远程对象的引用由持有该引用的客户机租用一段时间。租期从收到 dirty() 调用开始。在此类租约到期之前,客户机必须通过对远程引用额外调用 dirty() 来更新租约。如果客户机不在租约到期前进行续签,那么分布式垃圾收集器会假设客户机不再引用远程对象。

上面都是自己整理好的!我就把资料贡献出来给有需要的人!顺便求一波关注.

哈哈~各位小伙伴关注我后点击:    java架构交流群