C語言中的整數除了可以使用十進制,還可以使用二進制、八進制和十六進制。
二進制數、八進制數和十六進制數的表示
一個數字預設就是十進制的,表示一個十進制數字不需要任何特殊的格式。但是,表示一個二進制、八進制或者十六進制數字就不一樣了,為了和十進制數字區分開來,必須采用某種特殊的寫法,具體來說,就是在數字前面加上特定的字元,也就是加字首。
1) 二進制
二進制由 0 和 1 兩個數字組成,使用時必須以0b或0B(不區分大小寫)開頭,例如:
//合法的二進制
int a = 0b101; //換算成十進制為 5
int b = -0b110010; //換算成十進制為 -50
int c = 0B100001; //換算成十進制為 33
//非法的二進制
int m = 101010; //無字首 0B,相當于十進制
int n = 0B410; //4不是有效的二進制數字
讀者請注意,标準的C語言并不支援上面的二進制寫法,隻是有些編譯器自己進行了擴充,才支援二進制數字。換句話說,并不是所有的編譯器都支援二進制數字,隻有一部分編譯器支援,并且跟編譯器的版本有關系。
下面是實際測試的結果:
Visual C++ 6.0 不支援。
Visual Studio 2015 支援,但是 Visual Studio 2010 不支援;可以認為,高版本的 Visual Studio 支援二進制數字,低版本的 Visual Studio 不支援。
GCC 4.8.2 支援,但是 GCC 3.4.5 不支援;可以認為,高版本的 GCC 支援二進制數字,低版本的 GCC 不支援。
LLVM/Clang 支援(内嵌于 Mac OS 下的 Xcode 中)。
2) 八進制
八進制由 0~7 八個數字組成,使用時必須以0開頭(注意是數字 0,不是字母 o),例如:
//合法的八進制數
int a = 015; //換算成十進制為 13
int b = -0101; //換算成十進制為 -65
int c = 0177777; //換算成十進制為 65535
//非法的八進制
int m = 256; //無字首 0,相當于十進制
int n = 03A2; //A不是有效的八進制數字
3) 十六進制
十六進制由數字 0~9、字母 A~F 或 a~f(不區分大小寫)組成,使用時必須以0x或0X(不區分大小寫)開頭,例如:
//合法的十六進制
int a = 0X2A; //換算成十進制為 42
int b = -0XA0; //換算成十進制為 -160
int c = 0xffff; //換算成十進制為 65535
//非法的十六進制
int m = 5A; //沒有字首 0X,是一個無效數字
int n = 0X3H; //H不是有效的十六進制數字
4) 十進制
十進制由 0~9 十個數字組成,沒有任何字首,和我們平時的書寫格式一樣,不再贅述。
二進制數、八進制數和十六進制數的輸出
C語言中常用的整數有 short、int 和 long 三種類型,通過 printf 函數,可以将它們以八進制、十進制和十六進制的形式輸出。上節我們講解了如何以十進制的形式輸出,這節我們重點講解如何以八進制和十六進制的形式輸出,下表列出了不同類型的整數、以不同進制的形式輸出時對應的格式控制符:
short
int
long
八進制
%ho
%o
%lo
十進制
%hd
%d
%ld
十六進制
%hx 或者 %hX
%x 或者 %X
%lx 或者 %lX
十六進制數字的表示用到了英文字母,有大小寫之分,要在格式控制符中展現出來:
%hx、%x 和 %lx 中的x小寫,表明以小寫字母的形式輸出十六進制數;
%hX、%X 和 %lX 中的X大寫,表明以大寫字母的形式輸出十六進制數。
八進制數字和十進制數字不區分大小寫,是以格式控制符都用小寫形式。如果你比較叛逆,想使用大寫形式,那麼行為是未定義的,請你慎重:
有些編譯器支援大寫形式,隻不過行為和小寫形式一樣;
有些編譯器不支援大寫形式,可能會報錯,也可能會導緻奇怪的輸出。
注意,雖然部分編譯器支援二進制數字的表示,但是卻不能使用 printf 函數輸出二進制,這一點比較遺憾。當然,通過轉換函數可以将其它進制數字轉換成二進制數字,并以字元串的形式存儲,然後在 printf 函數中使用%s輸出即可。考慮到讀者的基礎還不夠,這裡就先不講這種方法了。
【執行個體】以不同進制的形式輸出整數:
#include
int main()
{
short a = 0b1010110; //二進制數字
int b = 02713; //八進制數字
long c = 0X1DAB83; //十六進制數字
printf("a=%ho, b=%o, c=%lo\n", a, b, c); //以八進制形似輸出
printf("a=%hd, b=%d, c=%ld\n", a, b, c); //以十進制形式輸出
printf("a=%hx, b=%x, c=%lx\n", a, b, c); //以十六進制形式輸出(字母小寫)
printf("a=%hX, b=%X, c=%lX\n", a, b, c); //以十六進制形式輸出(字母大寫)
return 0;
}
運作結果:
a=126, b=2713, c=7325603
a=86, b=1483, c=1944451
a=56, b=5cb, c=1dab83
a=56, b=5CB, c=1DAB83
從這個例子可以發現,一個數字不管以何種進制來表示,都能夠以任意進制的形式輸出。數字在記憶體中始終以二進制的形式存儲,其它進制的數字在存儲前都必須轉換為二進制形式;同理,一個數字在輸出時要進行逆向的轉換,也就是從二進制轉換為其他進制。
輸出時加上字首
請讀者注意觀察上面的例子,會發現有一點不完美,如果隻看輸出結果:
對于八進制數字,它沒法和十進制、十六進制區分,因為八進制、十進制和十六進制都包含 0~7 這幾個數字。
對于十進制數字,它沒法和十六進制區分,因為十六進制也包含 0~9 這幾個數字。如果十進制數字中還不包含 8 和 9,那麼也不能和八進制區分了。
對于十六進制數字,如果沒有包含 a~f 或者 A~F,那麼就無法和十進制區分,如果還不包含 8 和 9,那麼也不能和八進制區分了。
區分不同進制數字的一個簡單辦法就是,在輸出時帶上特定的字首。在格式控制符中加上#即可輸出字首,例如 %#x、%#o、%#lX、%#ho 等,請看下面的代碼:
#include
int main()
{
short a = 0b1010110; //二進制數字
int b = 02713; //八進制數字
long c = 0X1DAB83; //十六進制數字
printf("a=%#ho, b=%#o, c=%#lo\n", a, b, c); //以八進制形似輸出
printf("a=%hd, b=%d, c=%ld\n", a, b, c); //以十進制形式輸出
printf("a=%#hx, b=%#x, c=%#lx\n", a, b, c); //以十六進制形式輸出(字母小寫)
printf("a=%#hX, b=%#X, c=%#lX\n", a, b, c); //以十六進制形式輸出(字母大寫)
return 0;
}
運作結果:
a=0126, b=02713, c=07325603
a=86, b=1483, c=1944451
a=0x56, b=0x5cb, c=0x1dab83
a=0X56, b=0X5CB, c=0X1DAB83
十進制數字沒有字首,是以不用加#。如果你加上了,那麼它的行為是未定義的,有的編譯器支援十進制加#,隻不過輸出結果和沒有加#一樣,有的編譯器不支援加#,可能會報錯,也可能會導緻奇怪的輸出;但是,大部分編譯器都能正常輸出,不至于當成一種錯誤。