天天看點

有關位元組順序

在看《linux 網絡程式設計技術》時,提到了位元組順序的問題。知道網絡上的機器在表示資料的位元組順序是不同的,如i386晶片是地位元組在記憶體位址的地端,高位元組在高端,而alpha晶片卻相反。基于intel晶片的計算機采用的是資料存放順序是倒序存放,稱之為主機位元組順序;而internet上傳送資料的是順序存放的,稱之為網絡位元組順序。在資料被發送到網絡之前,必須進行位元組順尋轉換。可是還是有許多不明白,在網上找了些資料。

 主機位元組順序(Host)

  Little-Endian [ Intel、VAX和Unisys處理器 等]

 小端位元組序指低位元組資料存放在記憶體低位址處,高位元組資料存放在記憶體高位址處

  網絡位元組順序(Network)

  Big-Endian [ IBM 370、Motorola和大多數RISC設計 ---- IBM 大型機和大多數Unix平台 ]

現行的計算機都是以八位一個位元組為存儲機關,那麼一個16位的整數,也就是C語言中的short,在記憶體中可能有兩種存儲順序big-

endian和litte-endian.考慮一個short整數0x3132(0x32是低位,0x31是高位),把它指派給一個short變量,那麼

它在記憶體中的存儲可能有如下兩種情況:

大端位元組(Big-endian):

----------------->>>>>>>>記憶體位址增大方向

short變量位址

        0x1000                   0x1001

_____________________________

|                           |

|         0x31              |        0x32

|________________ | ________________

高位位元組在低位位元組的前面,也就是高位在記憶體位址低的一端.可以這樣記住(大端->高位->在前->正常的邏輯順序)

小端位元組(little-endian):

|         0x32              |        0x31

低位位元組在高位位元組的前面,也就是低位在記憶體位址低的一端.可以這樣記住(小端->低位->在前->與正常邏輯順序相反)

可以做個實驗

在windows上下如下程式

#include <stdio.h>

#include <assert.h>

void main( void )

{

         short test;

         FILE* fp;

         test = 0x3132;   //(31ASIIC碼的’1’,32ASIIC碼的’2’)

         if ((fp = fopen ("c:\test.txt", "wb")) == NULL)

               assert(0);

         fwrite(&test, sizeof(short), 1, fp);

         fclose(fp);

}

然後在C槽下打開test.txt檔案,可以看見内容是21,而test等于0x3132,可以明顯的看出來x86的位元組順序是低位在前.如果我們把這段

同樣的代碼放到(big-endian)的機器上執行,那麼打出來的檔案就是12.這在本機中使用是沒有問題的.但當你把這個檔案從一個big-

endian機器複制到一個little-endian機器上時就出現問題了.

如上述例子,我們在big-endian的機器上建立了這個test檔案,把其複制到little-endian的機器上再用fread讀到一個

short裡面,我們得到的就不再是0x3132而是0x3231了,這樣讀到的資料就是錯誤的,是以在兩個位元組順序不一樣的機器上傳輸資料時需要特别小

心位元組順序,了解了位元組順序在可以幫助我們寫出移植行更高的代碼.

正因為有位元組順序的差别,是以在網絡傳輸的時候定義了所有位元組順序相關的資料都使用big-endian,BSD的代碼中定義了四個宏來處理:

#define ntohs(n)      //網絡位元組順序到主機位元組順序 n代表net, h代表host, s代表short

#define htons(n)      //主機位元組順序到網絡位元組順序 n代表net, h代表host, s代表short

#define ntohl(n)       //網絡位元組順序到主機位元組順序 n代表net, h代表host, s代表 long

#define htonl(n)       //主機位元組順序到網絡位元組順序 n代表net, h代表host, s代表 long

舉例說明下這其中一個宏的實作:

#define sw16(x)

     ((short)(

         (((short)(x) & (short)0x00ffU) << 8) |

         (((short)(x) & (short)0xff00U) >> 8) ))

這裡實作的是一個交換兩個位元組順序.其他幾個宏類似.

我們改寫一下上面的程式

// 因為x86下面是低位在前,需要交換一下變成網絡位元組順序

#define htons(x) sw16(x)

         test = htons(0x3132); //(31ASIIC碼的’1’,32ASIIC碼的’2’)

        if ((fp = fopen ("c:\test.txt", "wb")) == NULL)

     如果在高位元組在前的機器上,由于與網絡位元組順序一緻,是以我們什麼都不幹就可以了,隻需要把#define htons(x) sw16(x)宏替換為 #define htons(x) (x).

繼續閱讀