X86 Cache 管理的几种模式
为了应对不同的应行场景,X86体系结构提供了多种维护cache一致性的模式和硬件机制。这些应用模式包括write back/write combing/write through/uncache,而和此相关的硬件包括store buffer, write combing buffer, MMTR,CR寄存器等。准确理解上面四种cache模式的差异,了解实现过程中的涉及到的不同硬件的模块,能够帮助工程师加深对系统结构的认识,从而能够针对 具体的应用,比如NVDIMM/NTB/SSD等,选择最合适的 等设备的cache模式。
1. store buffer
为了提高性能,允许内存写操作在真正执行完之前指令能够返回,X86处理器能够把对内存的写操作都临时存储到一个store buffer里面去。这个store buffer经常和指令执行部件关联在一起,它能够暂存对内存的读写,这样处理器就不用等真正的读写返回了。此外处理器还能自动保证序的正确性。当出现下面的情况下,硬件自动把store buffer里面的东西drain to memory:
中断;
内存屏障;
LOCK操作;
MFENCE/SFENCE;
IO操作
顺序指令
2.catch line
当处理器接受到从内存读的操作数刚好是可以cache的时候,处理器会从内存中读出长为cache line的数据到物理的cache line上去。
3.write combing/write through/write back/write protect的区别
3.1 write combiling:
读写没有cache,只是先写到了writing combing buffer,硬件不会自己维护memory一致性,对一致性有要求的软件必须留意到写往可WC的内存会出现延迟,并且如果对一致性有要求必须清空write combing buffer。注意write combing buffer 不同于L1/L2/L3 cache和store buffer,它只在WC模式下才会用到。它会在下面的情况下被硬件清空:
SFENCE/MFENCE指令
CPUID指令;
读写uncache的内存区域;
执行LOCK指令
在write combiling模式下,猜测读是允许的, 写操作可能会延迟,因为它可能会被合并到writing bffer里面去,直到后面的串行化指令例如(SFENCE,MFENCE,CPUID, read/write uncached memory,an interrupt, or LOCK instruction)出现。这种write combining 模式适合显存空间。
3.2 write though
读写可合并;写命中时:既到cache,又到内存,然后返回;写回内存时,invalid的cache没有catch fill,valid的cache有catch fill或者被invalid;
3.3 write back
读写可合并;写命中时:先到cache, 在需要释放它的cache line(比如cache full)时再写回内存;写不命中时,到内存,然后进行cache fill。
3.4 Write protect
写扩大到系统总线,并导致总线上的所有处理器相应的cache line都被invalid.
3.5 uncached
如果用unreached模式,只需要disable cache就可以,下面的步骤可以disablecache:
设置CR0上的CD为1, NW flag = 0;
disable MTRRs 且设置默认的内存类型是uncached(或者用MTRR设置所有的内存区域是uncache的)。
注意MTRR和OS 页表/页目录表之间的优先级及关系:
BIOS设置了好全局的MTRR表格之后,内核还是可以通过页表和页目录表进行修改。
为了维护cache一致性,需要用wbinvd命令,写回并无效所有的L1/L2/L3 Cache。
4. WBINVD和CFLUSH的区别
WBINVD:写回所有内部cache的有改动的cache line,然后无效L1/L2/L3级cache的内容
CFLUSH:把指定cache line里面的数据flush到内存,然后释放相应的cache line,这条指令提供了用户显示地释放cache空间的接口,特别当用户确定当前cache里面的内容暂时不会再访问到的时候可以用CFLUSH来释放cache line给其他数据用。
本文转自存储之厨51CTO博客,原文链接:http://blog.51cto.com/xiamachao/1746123 ,如需转载请自行联系原作者