天天看點

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

目錄

1. 資料類型介紹

1.1 類型的基本歸類

2. 整形在記憶體中的存儲

2.1 原碼、反碼、補碼

2.2 大小端介紹

2.3 練習題​​​​​​​

3. 浮點型在記憶體中的存儲

3.1 浮點數存儲的一個例子: 

3.2 浮點數存儲規則

1. 資料類型介紹

我們已經學習了基本的内置類型,以及他們所占存儲空間的大小

char             //字元資料類型,占1個位元組

short            //短整型,占2個位元組

int                //整形,占4個位元組

long            //長整型,占4個位元組

long long    //更長的整形,占8個位元組

float           //單精度浮點數,占4個位元組

double       //雙精度浮點數,占8個位元組

類型的意義:

1. 使用這個類型開辟記憶體空間的大小(大小決定了使用範圍)。

2. 如何看待記憶體空間的視角。(如int與float同樣都是4個位元組,看待的時候一個是整數一個是小數)

1.1 類型的基本歸類

整型家族:

char

        unsigned char

        signed char

short

        unsigned short [int], [int]可省略

        signed short [int], [int]可省略

int

        unsigned int

        signed int

long

        unsigned long [int], [int]可省略

        signed long [int], [int]可省略

int mian()
{
	char c = 'w'; //char到底是signed char 還是unsigned char是不确定的,取決于編譯器的實作
	signed char c2 = 't';

	short int a = 10; //short短整型,int可以省略
	short b = 20; //short是signed short

	signed short c = 30;
	unsigned short d = 40;

	return 0;
}
           

 浮點數家族:

float

double

構造類型(自定類型): 

> 數組類型

> 結構體類型 struct

> 枚舉類型 enum

> 聯合類型 union

指針類型:

int *pi;

char *pc;

float* pf;

void* pv; 

空類型: 

void 表示空類型(無類型)

通常應用于函數的傳回類型(無傳回類型)、函數的參數(無參數)、指針類型(空類型指針)

2. 整形在記憶體中的存儲

一個變量的建立是要在記憶體中開辟空間的,該空間的大小是根據不同的類型而決定的。

例如:

int a = 3;
int b = -1;
int c = 0x11223344;
           

a,b,c在記憶體中:

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲
C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲
C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

資料在記憶體中存儲是二進制

VS在展示記憶體的時候,為了友善展示顯示的是16進制資料,一個16進制位表示4個二進制位,兩個16進制位就是8個二進制位,即一個位元組(對于a,03 00 00 00表示四個位元組)

2.1 原碼、反碼、補碼

計算機中的整數有三種表示方法,即原碼、反碼和補碼。

三種表示方法均有符号位和數值位兩部分,符号位都是用0表示“正”,用1表示“負”,而數值位負整數的三種表示方法各不相同。 

原碼

直接将二進制按照正負數的形式翻譯成二進制即可得到。

反碼

将原碼的符号位不變,其他位依次按位取反即可得到。 

補碼

反碼+1得到補碼。 (原碼也可通過:補碼符号位不變,數值位按位取反,再+1得到)

 對于整數,可分為有符号數與無符号數

有符号數 :  符号位      +         數值位

正數        :    0          +         數值位

負數        :    1          +         數值位

//原碼 - 有符号數,直接根據正負數值給出的二進制序列就是原碼
//反碼 - 原碼的符号位不變,其他位按位取反
//補碼 - 反碼二進制的最低位+1得到

//正數的原碼、反碼、補碼相同
int main()
{
	int a = 3;    //signed int a = 3;
	//00000000000000000000000000000011         - 原碼
	//00000000000000000000000000000011         - 反碼
	//0000 0000 0000 0000 0000 0000 0000 0011  - 補碼
	//0    0    0    0    0    0    0    3     - 16進制(記憶體中)
	
	int b = -1;    //signed int b = -1;
	//10000000000000000000000000000001         - 原碼
	//11111111111111111111111111111110         - 反碼
	//1111 1111 1111 1111 1111 1111 1111 1111  - 補碼
	//f    f    f    f    f    f    f    f     - 16進制(記憶體中)
   
	return 0;
}
           

 對于16進制位0 1 2 3 4 5 6 7 8 9 a b c d e f,f 可由二進制 1111得到,而-1在記憶體中是 ff ff ff ff

結論:

1.正數的原、反、補碼都相同。

2.對于整型來說:資料存放記憶體中其實存放的是補碼。

為什麼呢?

在計算機系統中,數值一律用補碼來表示和存儲。原因在于,使用補碼,可以将符号位和數值域統一處理; 同時,加法和減法也可以統一處理(CPU隻有加法器)此外,補碼與原碼互相轉換,其運算過程是相同的,不需要額外的硬體電路。

例如:

int c = 1 - 1;
//CPU隻有加法器
//1 - 1 => 1 + (-1),此時用原碼來進行計算,結果是錯誤的(-2)
//用補碼來計算則可獲得正确結果(符号位也參與計算,進位後丢掉即可)
           

對于無符号數:和正整數是一樣的。

對char(8bit)而言:

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲
C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

對于int c = 0x11223344;

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

在記憶體中出現了“倒着存”的現象,為什麼呢?

2.2 大小端介紹

什麼是大端小端:

大端(存儲)模式,是指資料的低位儲存在記憶體的高位址中,而資料的高位,儲存在記憶體的低位址中;

小端(存儲)模式,是指資料的低位儲存在記憶體的低位址中,而資料的高位,,儲存在記憶體的高位址中。

對于 int c = 0x11223344;在記憶體中:

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

可見:目前的編譯器采用的是小端位元組序存儲方式

經典面試題:

請簡述大端位元組序和小端位元組序的概念,設計一個小程式來判斷目前機器的位元組序。(10分)

//寫一個代碼,判斷目前機器使用的大端還是小端

//方法1
int check_sys()
{
	int a = 1;
	return (*(char*)&a);
}
int main()
{
	int a = 1;
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

//方法2
int main()
{
	int a = 1;
	char* p = (char*)&a;//對p解引用則通路一個位元組 
	if (*p == 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	//
	//0x 00 00 00 01
	//
	//低       高
	//小端  
	//01 00 00 00
	//大端
	//00 00 00 01

	//隻需要看第一個位元組是00還是01即可判斷
	return 0;
}
           

2.3 練習題

下面代碼輸出結果是什麼?

//1.
//輸出什麼?
#include <stdio.h>
int main()
{
	char a = -1;
	//大部分編譯器基本上都是signed char
	//11111111 - a
	//11111111111111111111111111111111 - 整形提升後(此時是補碼)
	//10000000000000000000000000000001 - 原碼  -1
	signed char b = -1;
	//11111111 - b 
	//計算過程和a一樣 -1
	unsigned char c = -1;
	//11111111 - c
	//00000000000000000000000011111111 - 正數的原反補碼都相同
	//十進制 : 255

	printf("a=%d,b=%d,c=%d", a, b, c);//a = -1, b = -1, c = 255
	//列印%d時會發生整形提升(按照符号位提升)
	return 0;
}
           
//2.
#include <stdio.h>
int main()
{
	char a = -128;
	//10000000000000000000000010000000 - -128原碼
	//11111111111111111111111110000000 - -128補碼
	//1000000                          - 存到a中
	//整形提升後:
	//11111111111111111111111110000000 - 4294967168 (2^32 - 127 - 1)
	
    //%u : 列印無符号整形
	printf("a = %u\n", a); //a = 4294967168
	return 0;
}
           
//3.
#include <stdio.h>
int main()
{
	char a = 128;
	//00000000000000000000000010000000 - 128原碼
	//10000000                         - 存到a中
	//整形提升後
	//11111111111111111111111110000000 - 4294967168
	printf("a = %u\n", a); // a = 4294967168
	return 0;
}
           
//4.
int main()
{
	int i = -20;
	//10000000000000000000000000010100 - -20原碼
	//11111111111111111111111111101100 - -20補碼
	unsigned  int  j = 10;
	//00000000000000000000000000001010 -  10原(補)碼
	
	//11111111111111111111111111110110 - i + j 補碼
	//10000000000000000000000000001010 - i + j 原碼: -10
	printf("i+j = %d\n", i + j); // i+j = -10
	//按照補碼的形式進行運算,最後格式化成為有符号整數

    return 0;
}
           
//5.
int main()
{
	unsigned int i;//因為i定義的是無符号類型 則始終有:i >= 0; 

	for(i = 9; i >= 0; i--)
	{
		printf("%u\n", i); //死循環
		//當i = -1存入記憶體中(之後以此類推):
		//11111111111111111111111111111111 - 當做無符号數處理 - 一個巨大的正數
	}
	return 0;
}
           
//6.
int main()
{
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		a[i] = -1 - i;
	}
	//a[i]從-1 -2 ... -128 共有128個數字
	//對于char來說 負數最多到 : -128
	//當存入-129時,對于char而言是放不下的
	//10000000000000000000000010000001 - -129原碼
	//11111111111111111111111101111111 - -129補碼
	//01111111                         - -129存入char中 - 127
	//以此類推,存入-130時,記憶體中實際存儲的是126
	//127 126 ... 3 2 1 0,0之前共有127個數字(因為strlen遇到0就終止了)
	//127 + 128 = 255
	printf("%d", strlen(a));//255
	return 0;
}
           
//7.
#include <stdio.h>
unsigned char i = 0;
//對于無符号的char 取值範圍是[0 , 255]
//對于下面代碼,i <= 255恒成立,故死循環了
int main()
{
	for (i = 0; i <= 255; i++)
	{
		printf("hello world\n");//死循環
	}
	return 0;
}
           

 注:對于有符号的char,記住下圖,(無符号的char範圍 : [ 0 , 255] ):

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

3. 浮點型在記憶體中的存儲

常見的浮點數:

3.14159

1E10 (科學計數法,1.0 * 10^10)

浮點數家族包括: float、double、long double 類型。

浮點數表示的範圍:float.h中定義(整型家族 : 取值範圍的定義 -> limits.h)

3.1 浮點數存儲的一個例子: 

int main()
{
	int n = 9;
	float* pFloat = (float*)&n; //把int*類型指針強制轉換成float*類型
	printf("n的值為:%d\n", n); //9
	printf("*pFloat的值為:%f\n", *pFloat);//0.000000
	*pFloat = 9.0;
	printf("n的值為:%d\n", n); //1091567616
	printf("*pFloat的值為:%f\n", *pFloat); //9.000000
	
	return 0;
}
           

說明:浮點型數的存儲和整形不一樣。那麼浮點數是如何存儲的呢?

3.2 浮點數存儲規則

根據國際标準IEEE(電氣和電子工程協會) 754,任意一個二進制浮點數V可以表示成下面的形式:

(-1)^S * M * 2^E

(-1)^s表示符号位,當s=0,V為正數;當s=1,V為負數。

M表示有效數字,大于等于1,小于2。

2^E表示指數位。

對于5.5:

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

IEEE 754規定: 對于32位的浮點數,最高的1位是符号位s,接着的8位是指數E,剩下的23位為有效數字M:

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

例如:

int main()
{
	float f = 5.5f;//如果不寫f,則預設是double類型
	//101.1
	//1.011 * 2^2
	//(-1)^0 * 1.011 * 2^2
	//S = 0,E =10000001 (2 + 127),M = 011(後面再補20個0)
	//0100 0000 1011 0000 0000 0000 0000 0000 - 記憶體中存儲的二進制
	//4    0    11   0    0    0    0    0    
	//40 B0 00 00 - 十六進制

	return 0;
}
           

f = 5.5f在記憶體中:

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

 對于64位的浮點數,最高的1位是符号位S,接着的11位是指數E,剩下的52位為有效數字M

C語言進階:深度剖析資料在記憶體中的存儲1. 資料類型介紹2. 整形在記憶體中的存儲3. 浮點型在記憶體中的存儲

IEEE 754對有效數字M和指數E,還有一些特别規定:

前面說過, 1≤M<2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數部分。 IEEE 754規定,在計算機内部儲存M時,預設這個數的第一位總是1,是以可以被舍去,隻儲存後面的 xxxxxx部分。比如儲存1.01的時候,隻儲存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M隻有23位, 将第一位的1舍去以後,等于可以儲存24位有效數字。

至于指數E,情況就比較複雜:

首先,E為一個無符号整數(unsigned int),

這意味着,如果E為8位,它的取值範圍為0~255;如果E為11位,它的取值範圍為0~2047。但是,我們知道,科學計數法中的E是可以出現負數的,是以IEEE754規定,存入記憶體時E的真實值必須再加上一個中間數,對于8位的E,這個中間數是127;對于11位的E,這個中間數是1023。比如,2^10的E是10,是以儲存成32位浮點數時,必須儲存成10+127=137,即 10001001。

其次,指數E從記憶體中取出還可以再分成三種情況:

E不全為0或不全為1

這時,浮點數就采用下面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再将有效數字M前加上第一位的1。

比如: 0.5(1/2)的二進制形式為0.1,由于規定正數部分必須為1,即将小數點右移1位,則為 1.0*2^(-1),其階碼為-1+127=126,表示為 01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,則其二進 制表示形式為:

0 01111110 00000000000000000000000

E全為0:

這時,浮點數的指數E等于1-127(或者1-1023)即為真實值,

有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。這樣做是為了表示±0,以及接近于0的很小的數字。​​​​​​​

例如:

//0 00000000 01000100101000000000000
	//E+127存入資料後是00000000
	//真實的E = -127
	//(-1)^0 * 1.01000100101 * 2^(-127) - 無限接近于0的數字
	
	//是以對于接近0的數字:
	//M拿出來不+1,E = -126(32位)
	//(-1)^0 * 0.01000100101 * 2^(-126) - 真實取出時的數字,也無限接近于0
           

E全為1

這時,如果有效數字M全為0,表示±無窮大(正負取決于符号位s)
//E為全1
	//E + 128 = 255
	//E = 127
	//(+ -) * 1.xxxxxx * 2 ^ 128 - 趨近于正負無限大
           

關于浮點數的表示規則,就聊到這裡。

有了上面的基礎:讓我們回到一開始的問題:為什麼 0x00000009 還原成浮點數,就成了 0.000000 ?

int main()
{
	int n = 9;
	//00000000000000000000000000001001 - 二進制

	float* pFloat = (float*)&n; //把int*類型指針強制轉換成float*類型
	printf("n的值為:%d\n", n); //9
	
	printf("*pFloat的值為:%f\n", *pFloat);//0.000000
	//*pFloat - 以浮點數的視角去通路n的四個位元組,就會認為n的4個位元組中放的是浮點數
	//0 00000000 00000000000000000001001 (E全0的情況)
	//(-1)^0 * 2 ^ (-126) * 0.00000000000000000001001
	//0.000000
	
	*pFloat = 9.0;
	//*pFloat - 以浮點數的視角觀察n的4個位元組
	//以浮點數的形式存儲9.0
	//1001.0 - 二進制
	//1.001 * 2^3 - 科學計數法
	//(-1)^0 * 1.001 * 2^3
	//S = 0,E = 130(3 + 127). M = 00100000000000000000000 
	//0 10000010 00100000000000000000000 - 記憶體中存儲形式
	//1091567616 - 二進制
	printf("n的值為:%d\n", n); //1091567616
	printf("*pFloat的值為:%f\n", *pFloat); //9.000000

	return 0;
}
           

繼續閱讀