天天看点

Java堆的理解

堆的核心概述

  • 所有的对象实例以及数组都应当在运行时分配在堆上
    • 从实际实用角度看 --"几乎所有的对象实例都在堆中分配内存"
  • 数组和对象可能永远不会存储在栈上,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置
  • 在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除
  • 堆,是GC执行垃圾回收的重点区域

内存细分

Java堆的理解
# 1. 堆空间的大小设置
	-Xms  用来设置堆空间(年轻代+老年代)的初始内存大小
        -X 是jvm的运行参数
        ms 是memory start
	-Xmx  用来设置堆空间(年轻代+老年代) 的最大内存大小

# 2. 默认堆空间的大小
	初始内存大小:物理电脑内存大小/64
	最大内存大小:物理电脑内存大小/4

# 3. 手动设置: -Xms600m -Xmx600m
	开发中建议将初始堆内存和最大的堆内存设置成相同的值.

- 原因:值不同,当达到堆的初始内存大小后,堆会不断扩容,当空闲时又会释放内存,频繁的扩容与释放会造成不必要的系统压力.

# 4. 查看设置的参数:
	方式一:在命令行中jps 查看进程号
	jstat -gc 进程id
	方式二: 增加参数 -XX:+PrintGCDetails
           

新生代与老年代

  • 存储在JVM中的Java对象可以被划分为两类
    • 一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
    • 另一类对象的生命周期却非常长,在某些极端情况下还能与JVM的生命周期保持一致
  • Java堆区进一步细分的话,可以划分为年轻代(YoungGen)和老年代(OldGen)
    • 几乎所有的Java对象都是在Eden区被new出来的.
    • 绝大部分的Java对象的销毁都在新生代进行了
  • 其中年轻代又可以划分为Eden空间,Survivor0空间和Survivor1空间(有时也叫做from区,to区)
Java堆的理解
# 新生代与老年代相关参数设置
> 配置新生代与老年代在堆结构的占比
	> 默认:-XX:NewRatio=2,表示新生代占1,老年代占2,新生代占整个堆的1/3
	>可以修改为:-XX:NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5
	
- 如果程序很多对象生命周期比较长,可以考虑将老年代占比调大

> 在HotSpot中,Eden空间和另外两个Survivor空间缺省所占的比例是8:1:1

>可以通过选项 -XX:SurvivorRatio=x 调整这个空间比例

> 但是会有个问题,实际的比例并不足8:1:1,实际是6:1:1
	可以通过 -XX:-UseAdaptiveSizePolicy  关闭自适应的内存分配策略(实测无用)
	最好还是直接设置-XX:SurvivorRatio=8
           

对象分配的一般过程

  1. new的对象先放在伊甸园区,此区有大小限制
  2. 当伊甸园的空间填满时,程序有需要创建对象,JVM的垃圾回收器将对伊甸园区进行垃圾回收(Minor GC),将伊甸园区中的不再被其他对象所引用的对象进行销毁,再加载新的对象放到伊甸园区
    Java堆的理解
  3. 然后将伊甸园中的剩余对象移动到幸存者0区
  4. 如果再次触发垃圾回收,此时上次幸存下来的放到幸存者0区的,如果没有回收,就会放到幸存者1区
    Java堆的理解
  5. 如果再次经历垃圾回收,此时会重新放回幸存者0区,接着再去幸存者1区
  6. 直到这个对象存活了15次,这个对象就可以去养老区了
    • 可以通过设置参数:

      -XX:MaxTenuringThreshold=<N>

      进行设置
    Java堆的理解

具体流程图:

Java堆的理解

常用调优工具

  • JDK命令行 (jsp,jstat)
  • Jconsole
  • JVisualVM
  • Jprofiler
  • Java Flight Recorder
  • GCViewer
  • GC Easy

Minor GC,Major GC,Full GC

JVM再进行GC时,并非每次都对上面三个内存(新生代,老年代,方法区)区域一起回收的,大部分时候回收的都是指新生代

正如HotSpot VM的实现,它里面的GC按照回收区域又分为两大种类型:一种是部分收集(Partial GC),一种是整堆收集(Full GC)

  • 部分收集:不是完整收集整个Java对的垃圾收集.其中又分为:
    • 新生代收集(Young GC):只是新生代(Eden,S0,S1)的垃圾收集
    • 老年代收集(Major GC/Old GC):只是老年代的垃圾收集
    • 混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾收集
  • 整堆收集(Full GC):收集整个Java堆和方法区的垃圾收集.

年轻代GC(Minor GC)触发机制:

  • 当年轻代空间不足时,就会触发Minor GC 这里的年轻代满指的时Eden代满,Survivor满不会引发GC.
  • 因为Java对象大多都具备朝生夕灭的特性,所以MinorGC非常频繁,一般回收速度也比较快
  • Minor GC会引发STW(Stop The World),暂停其他用户的线程,等垃圾回收结束,用户线程才恢复运行

老年代GC(Major GC/Full GC)触发机制:

  • 发生在老年代的GC,对象从老年代消失时,我们说"Major GC"或"Full GC"就发生了.
  • 出现了Major GC,进场会伴随至少一次的Minor GC
    • 也就是在老年代空间不足时.会先尝试触发Minor GC,如果之后空间还不足,则出发Major GC
  • Major GC的速度一般会比Minor GC慢10倍以上,STW的时间更长
  • 如果Major GC后,内存还不足,就会出现OOM.

Full GC触发机制

  1. 调用System.gc()时,系统建议执行Full GC,但是不必然执行
  2. 老年代空间不足
  3. 方法区空间不足
  4. 通过Minor GC进入老年代的平均大小大于老年代的可用内存
  5. 由Eden区,Survivor0区向Survivor1区复制时,对象大小大于Survivor1区可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小

为什么需要Java堆分代?

分代的唯一理由就是优化GC性能,如果没有分代,那所有的对象都在一块,Gc的时候要找到哪些对象没用,这里就会对堆的所有区域进行扫描.而很多对象生命周期都很短,如果分代的话,把新创建的对象放到一块,当GC的时候先把这块存储"朝生夕死"对象的区域进行回收,这样就会腾出很大的空间出来

内存分配策略

如果对象再Eden出生并经过第一次MinorGC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并将对象年龄设为1.对象在Survivor区中每熬过一次MinorGC,年龄就增加1岁,当他的年龄增加到一定程度(默认为15岁)时,就会被晋升到老年代中

对象晋升老年代的年龄阈值可以通过设置参数:

-XX:MaxTenuringThreshold=<N>

进行设置

针对不同年龄段的对象分配原则如下所示:

  • 优先分配到Eden
  • 大对象直接分配到老年代
    • 尽量避免程序中出现过多的大对象
  • 长期存活的对象分配到老年代
  • 动态对象年龄判断
    • 如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无需等到MaxTenuringThreshold中要求的年龄
  • 空间分配担保
    • -XX:HandlePromotionFailure

TLAB(Thread Local Allocation Buffer)

为什么有TLAB?

  • 堆区是线程共享区域,任何线程都可以访问到堆区中的共享数据
  • 由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的
  • 为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度

什么是TLAB?

  • 从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分,JVM为每个线程分配了一个私有缓存区域,它包含在Eden空间内
  • 多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为 快速分配策略

堆空间的常用参数设置总结

** -XX:+PrintFlagsInitial:查看所有的参数的默认初始值
   -xx:+PrintFlagsFinal:查看所有的参数的最终值
   具体查看某个参数的指令:
   	jps:查看当前运行中的进程
   	jinfo -flag SurvivorRatio 进程id
   -Xms:初始堆空间内存(默认为物理内存的1/64)
   -Xmx:最大堆空间内存(默认为物理内存的1/4)
   -Xmn:设置新生代的大小(初始值及最大值)
   -XX:NewRatio:配置新生代与老年代在堆结构的占比
   -XX:SurvivorRatio:设置新生代中Eden和S0/S1空间的比例
   -XX:MaxTenuringThreshold:设置新生代垃圾的最大年龄
   -XX:PrintGCDetails:输出详细的GC处理日志
   -XX:PrintGC:打印GC简要信息
   -XX:HandlePromotionFailure:是否设置空间分配担保
           

堆是分配对象存储的唯一选择么?

在《深入理解Java虚拟机》中关于Java堆内存有这样一段描述:

随着JIT编译期的发展与逃逸分析技术逐渐成熟,栈上分配,标量替换优化技术将会导致一些微妙的变化,所有的对象都分配到堆上也渐渐变得不那么"绝对"了.

  • 在Java虚拟机中,对象是在Java堆中分配内存的,这是一个普遍的常识.但是,有一种特殊情况,那就是如果经过逃逸分析后发现,一个对象并没有逃逸出方法的话,那么就可能被优化成栈上分配.这样就无需在堆上分配内存,也无需进行垃圾回收了,这也是最常见的堆外存储技术
  • 此外,TaoBaoVM,其中创新的GCIH(GC invisible heap)技术实现off-heap,将生命周期较长的Java对象从heap中移至heap外,并且GC不能管理GCIH内部的对象,以此达到降低GC的回收频率和提升GC的回收效率的目的

举个栗子:

pubilc static StringBuffer createStringBuffer(String s1,String s2){
    StringBuffer sb = new StringBuffer();
    sb.append(s1);
    sb.append(s2);
    //这个方法内新建的对象sb可能会被其他方法调用,即这个变量可能会逃逸,因此不能采用栈上分配的策略
    return sb;
}
           
pubilc static String createStringBuffer(String s1,String s2){
    StringBuffer sb = new StringBuffer();
    sb.append(s1);
    sb.append(s2);
    //此时StringBuffer没有逃逸,但是toString()方法新建的String对象逃逸了.....
    return sb.toString();
}
           
开发中能使用局部变量,就不要使用在方法外定义

逃逸分析:代码优化

使用逃逸分析,编译器可以对代码做如下优化:

  1. 栈上分配.将堆分配转换为栈分配.如果一个对象在子程序中被分配,要使指向该对象的指针永远不会逃逸,对象可能是栈分配的候选,而不是堆分配
  2. 同步省略.如果一个对象被发现只能从一个线程被访问到,那么对于这个对象的操作可以不考虑同步
  3. 分离对象或标量替换.有的对象可能不需要作为一个连续的内存结构存在也可以本访问到,那么对象的部分或全部可以不存储在内存,而是存储在CPU寄存器中

逃逸分析并不成熟

  • 关于逃逸分析的论文在1999年就已经发表了,但直到JDK 1.6才有实现,而且这项技术到如今也并不是十分成熟的。
  • 其根本原因就是无法保证逃逸分析的性能消耗一定能高于他的消耗。虽然经过逃逸分析可以做标量替换、栈上分配、和锁消除。但是逃逸分析自身也是需要进行一系列复杂的分析的,这其实也是一个相对耗时的过程。
  • 一个极端的例子,就是经过逃逸分析之后,发现没有一个对象是不逃逸的。那这个逃逸分析的过程就白白浪费掉了.
  • 有一些观点,认为通过逃逸分析,JVM会在栈上分配那些不会逃逸的对象,这在理论上是可行的,但是取决于JVM设计者的选择,Oracle HotspotJVM中并未这么做,所以可以明确所有的对象实例都是创建在堆上.

总结

  • 年轻代是对象的诞生,成长,消亡的区域,一个对象在这里产生,应用,最后被垃圾回收器收集,结束生命
  • 老年代放置长生命周期的对象,通常都是从Survivor区域筛选拷贝过来的Java对象,也有例外:如果对象太大,完全无法在新生代找到足够长的连续空闲空间,JVM就会直接分配到老年代.
  • 当GC只发生在年轻代中,回收年轻代对象的行为被称为MinorGC,当GC发生在老年代时则被称为MajorGC或者FullGC.一般的,MinorGC的发生频率要比MajorGC高很多