天天看點

JavaIO之:NIO中那些奇怪的Buffer簡介Buffer的分類Big Endian 和 Little Endianaligned記憶體對齊總結

簡介

妖魔鬼怪快快顯形,今天F師兄幫助小師妹來斬妖除魔啦,什麼BufferB,BufferL,BufferRB,BufferRL,BufferS,BufferU,BufferRS,BufferRU統統給你剖析個清清楚楚明明白白。

Buffer的分類

小師妹:F師兄不都說JDK源碼是最好的java老師嗎?為程不識源碼,就稱牛人也枉然。但是我最近在學習NIO的時候竟然發現有些Buffer類居然沒有注釋,就那麼突兀的寫在哪裡,讓人好生心煩。

更多内容請通路www.flydean.com

居然還有這樣的事情?快帶F師兄去看看。

小師妹:F師兄你看,以ShortBuffer為例,它的子類怎麼後面都帶一些奇奇怪怪的字元:

JavaIO之:NIO中那些奇怪的Buffer簡介Buffer的分類Big Endian 和 Little Endianaligned記憶體對齊總結

什麼什麼BufferB,BufferL,BufferRB,BufferRL,BufferS,BufferU,BufferRS,BufferRU都來了,點進去看他們的源碼也沒有說明這些類到底是做什麼的。

還真有這種事情,給我一個小時,讓我仔細研究研究。

一個小時後,小師妹,經過我一個小時的辛苦勘察,結果發現,确實沒有官方文檔介紹這幾個類到底是什麼含義,但是師兄我掐指一算,好像發現了這些類之間的小秘密,且聽為兄娓娓道來。

之前的文章,我們講到Buffer根據類型可以分為ShortBuffer,LongBuffer,DoubleBuffer等等。

但是根據本質和使用習慣,我們又可以分為三類,分别是:ByteBufferAsXXXBuffer,DirectXXXBuffer和HeapXXXBuffer。

ByteBufferAsXXXBuffer主要将ByteBuffer轉換成為特定類型的Buffer,比如CharBuffer,IntBuffer等等。

而DirectXXXBuffer則是和虛拟記憶體映射打交道的Buffer。

最後HeapXXXBuffer是在堆空間上面建立的Buffer。

Big Endian 和 Little Endian

小師妹,F師兄,你剛剛講的都不重要,我就想知道類後面的B,L,R,S,U是做什麼的。

好吧,在給你講解這些内容之前,師兄我給你講一個故事。

話說在明末浙江才女吳绛雪寫過一首詩:《春 景 詩》

莺啼岸柳弄春晴,

柳弄春晴夜月明。

明月夜晴春弄柳,

晴春弄柳岸啼莺。

小師妹,可有看出什麼特異之處?最好是多讀幾遍,讀出聲來。

小師妹:哇,F師兄,這首詩從頭到尾和從尾到頭讀起來是一樣的呀,又對稱又有意境!

不錯,這就是中文的魅力啦,根據讀的方式不同,得出的結果也不同,其實在計算機世界也存在這樣的問題。

我們知道在java中底層的最小存儲單元是Byte,一個Byte是8bits,用16進制表示就是Ox00-OxFF。

java中除了byte,boolean是占一個位元組以外,好像其他的類型都會占用多個位元組。

如果以int來舉例,int占用4個位元組,其範圍是從Ox00000000-OxFFFFFFFF,假如我們有一個int=Ox12345678,存到記憶體位址裡面就有這樣兩種方式。

第一種Big Endian将高位的位元組存儲在起始位址

JavaIO之:NIO中那些奇怪的Buffer簡介Buffer的分類Big Endian 和 Little Endianaligned記憶體對齊總結

第二種Little Endian将地位的位元組存儲在起始位址

JavaIO之:NIO中那些奇怪的Buffer簡介Buffer的分類Big Endian 和 Little Endianaligned記憶體對齊總結

其實Big Endian更加符合人類的讀寫習慣,而Little Endian更加符合機器的讀寫習慣。

目前主流的兩大CPU陣營中,PowerPC系列采用big endian方式存儲資料,而x86系列則采用little endian方式存儲資料。

如果不同的CPU架構直接進行通信,就由可能因為讀取順序的不同而産生問題。

java的設計初衷就是一次編寫處處運作,是以自然也做了設計。

是以BufferB表示的是Big Endian的buffer,BufferL表示的是Little endian的Buffer。

而BufferRB,BufferRL表示的是兩種隻讀Buffer。

aligned記憶體對齊

小師妹:F師兄,那這幾個又是做什麼用的呢? BufferS,BufferU,BufferRS,BufferRU。

在講解這幾個類之前,我們先要回顧一下JVM中對象的存儲方式。

還記得我們是怎麼使用JOL來分析JVM的資訊的嗎?代碼非常非常簡單:

log.info("{}", VM.current().details());           

複制

輸出結果:

# Running 64-bit HotSpot VM.
# Using compressed oop with 3-bit shift.
# Using compressed klass with 3-bit shift.
# WARNING | Compressed references base/shifts are guessed by the experiment!
# WARNING | Therefore, computed addresses are just guesses, and ARE NOT RELIABLE.
# WARNING | Make sure to attach Serviceability Agent to get the reliable addresses.
# Objects are 8 bytes aligned.
# Field sizes by type: 4, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]
# Array element sizes: 4, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]           

複制

上面的輸出中,我們可以看到:Objects are 8 bytes aligned,這意味着所有的對象配置設定的位元組都是8的整數倍。

再注意上面輸出的一個關鍵字aligned,确認過眼神,是對的那個人。

aligned對齊的意思,表示JVM中的對象都是以8位元組對齊的,如果對象本身占用的空間不足8位元組或者不是8位元組的倍數,則補齊。

還是用JOL來分析String對象:

[main] INFO com.flydean.JolUsage - java.lang.String object internals:
 OFFSET  SIZE      TYPE DESCRIPTION                               VALUE
      0    12           (object header)                           N/A
     12     4    byte[] String.value                              N/A
     16     4       int String.hash                               N/A
     20     1      byte String.coder                              N/A
     21     1   boolean String.hashIsZero                         N/A
     22     2           (loss due to the next object alignment)
Instance size: 24 bytes
Space losses: 0 bytes internal + 2 bytes external = 2 bytes total           

複制

可以看到一個String對象占用24位元組,但是真正有意義的是22位元組,有兩個2位元組是補齊用的。

對齊的好處顯而易見,就是CPU在讀取資料的時候更加友善和快捷,因為CPU設定是一次讀取多少位元組來的,如果你存儲是沒有對齊的,則CPU讀取起來效率會比較低。

現在可以回答部分問題:BufferU表示是unaligned,BufferRU表示是隻讀的unaligned。

小師妹:那BufferS和BufferRS呢?

這個問題其實還是很難回答的,但是經過師兄我的不斷研究和探索,終于找到了答案:

先看下DirectShortBufferRU和DirectShortBufferRS的差別,兩者的差別在兩個地方,先看第一個Order:

DirectShortBufferRU:

public ByteOrder order() {
        return ((ByteOrder.nativeOrder() != ByteOrder.BIG_ENDIAN)
                ? ByteOrder.LITTLE_ENDIAN : ByteOrder.BIG_ENDIAN);
    }           

複制

DirectShortBufferRS:

public ByteOrder order() {
        return ((ByteOrder.nativeOrder() == ByteOrder.BIG_ENDIAN)
                ? ByteOrder.LITTLE_ENDIAN : ByteOrder.BIG_ENDIAN);
    }           

複制

可以看到DirectShortBufferRU的Order是跟nativeOrder是一緻的。而DirectShortBufferRS的Order跟nativeOrder是相反的。

為什麼相反?再看兩者get方法的不同:

DirectShortBufferU:

public short get() {
        try {
            checkSegment();
            return ((UNSAFE.getShort(ix(nextGetIndex()))));
        } finally {
            Reference.reachabilityFence(this);
        }
    }           

複制

DirectShortBufferS:

public short get() {
        try {
            checkSegment();
            return (Bits.swap(UNSAFE.getShort(ix(nextGetIndex()))));
        } finally {
            Reference.reachabilityFence(this);
        }
    }           

複制

差別出來了,DirectShortBufferS在傳回的時候做了一個bits的swap操作。

是以BufferS表示的是swap過後的Buffer,和BufferRS表示的是隻讀的swap過後的Buffer。

總結

不寫注釋實在是害死人啊!尤其是JDK自己也不寫注釋的情況下!