天天看點

C/C+語言struct深層探索

<b></b>

<b>出處:PConline  作者:宋寶華  </b>

 

<b>1.     </b><b>struct</b><b>的巨大作用</b>

面對一個人的大型C/C++程式時,隻看其對struct的使用情況我們就可以對其編寫者的程式設計經驗進行評估。因為一個大型的C/C++程式,勢必要涉及一些(甚至大量)進行資料組合的結構體,這些結構體可以将原本意義屬于一個整體的資料組合在一起。從某種程度上來說,會不會用struct,怎樣用struct是差別一個開發人員是否具備豐富開發經曆的标志。

在網絡協定、通信控制、嵌入式系統的C/C++程式設計中,我們經常要傳送的不是簡單的位元組流(char型數組),而是多種資料組合起來的一個整體,其表現形式是一個結構體。

經驗不足的開發人員往往将所有需要傳送的内容依順序儲存在char型數組中,通過指針偏移的方法傳送網絡封包等資訊。這樣做程式設計複雜,易出錯,而且一旦控制方式及通信協定有所變化,程式就要進行非常細緻的修改。

一個有經驗的開發者則靈活運用結構體,舉一個例子,假設網絡或控制協定中需要傳送三種封包,其格式分别為packetA、packetB、packetC:

struct structA

{

int a;

char b;

};

struct structB

char a;

short b;

struct structC

float c;

}

優秀的程式設計者這樣設計傳送的封包:

struct CommuPacket

int iPacketType;  //封包類型标志

union      //每次傳送的是三種封包中的一種,使用union

        struct structA packetA;

        struct structB packetB;

        struct structC packetC;

在進行封包傳送時,直接傳送struct CommuPacket一個整體。

假設發送函數的原形如下:

// pSendData:發送位元組流的首位址,iLen:要發送的長度

Send(char * pSendData, unsigned int  iLen);

發送方可以直接進行如下調用發送struct CommuPacket的一個執行個體sendCommuPacket:

Send( (char *)&amp;sendCommuPacket , sizeof(CommuPacket) );

假設接收函數的原形如下:

// pRecvData:發送位元組流的首位址,iLen:要接收的長度

//傳回值:實際接收到的位元組數

unsigned int Recv(char * pRecvData, unsigned int  iLen);

接收方可以直接進行如下調用将接收到的資料儲存在struct CommuPacket的一個執行個體recvCommuPacket中:

Recv( (char *)&amp;recvCommuPacket , sizeof(CommuPacket) );

接着判斷封包類型進行相應處理:

switch(recvCommuPacket. iPacketType)

case PACKET_A:

…    //A類封包處理

break;

case PACKET_B:

…   //B類封包處理

case PACKET_C:

…   //C類封包處理

以上程式中最值得注意的是

中的強制類型轉換:(char *)&amp;sendCommuPacket、(char *)&amp;recvCommuPacket,先取位址,再轉化為char型指針,這樣就可以直接利用處理位元組流的函數。

利用這種強制類型轉化,我們還可以友善程式的編寫,例如要對sendCommuPacket所處記憶體初始化為0,可以這樣調用标準庫函數memset():

memset((char *)&amp;sendCommuPacket,0, sizeof(CommuPacket));

<b>2.     </b><b>struct</b><b>的成員對齊</b>

Intel、微軟等公司曾經出過一道類似的面試題:

1. #include &lt;iostream.h&gt;

2. #pragma pack(8)

3. struct example1

4. {

5. short a;

       6. long b;

7. };

8. struct example2

9. {

       10. char c;

       11. example1 struct1;

       12. short e;   

13. };

14. #pragma pack()

15. int main(int argc, char* argv[])

16. {

       17. example2 struct2;

       18. cout &lt;&lt; sizeof(example1) &lt;&lt; endl;

19. cout &lt;&lt; sizeof(example2) &lt;&lt; endl;

       20. cout &lt;&lt; (unsigned int)(&amp;struct2.struct1) - (unsigned int)(&amp;struct2)

&lt;&lt; endl;

       21. return 0;

22. }

問程式的輸入結果是什麼?

答案是:

8

16

4

不明白?還是不明白?下面一一道來:

<b>2.1 </b><b>自然對界</b>

struct是一種複合資料類型,其構成元素既可以是基本資料類型(如int、long、float等)的變量,也可以是一些複合資料類型(如array、struct、union等)的資料單元。對于結構體,編譯器會自動進行成員變量的對齊,以提高運算效率。預設情況下,編譯器為結構體的每個成員按其自然對界(natural alignment)條件配置設定空間。各個成員按照它們被聲明的順序在記憶體中順序存儲,第一個成員的位址和整個結構的位址相同。

自然對界(natural alignment)即預設對齊方式,是指按結構體的成員中size最大的成員對齊。

例如:

struct naturalalign

     char a;

     short b;

     char c;

在上述結構體中,size最大的是short,其長度為2位元組,因而結構體中的char成員a、c都以2為機關對齊,sizeof(naturalalign)的結果等于6;

如果改為:

     int b;

其結果顯然為12。

<b>2.2</b><b>指定對界</b>

一般地,可以通過下面的方法來改變預設的對界條件:

  · 使用僞指令#pragma pack (n),編譯器将按照n個位元組對齊;

· 使用僞指令#pragma pack (),取消自定義位元組對齊方式。

注意:<b>如果</b><b>#pragma pack (n)</b><b>中指定的</b><b>n</b><b>大于結構體中最大成員的</b><b>size</b><b>,則其不起作用,結構體仍然按照</b><b>size</b><b>最大的成員進行對界。</b>

#pragma pack (n)

#pragma pack ()

當n為4、8、16時,其對齊方式均一樣,sizeof(naturalalign)的結果都等于12。而當n為2時,其發揮了作用,使得sizeof(naturalalign)的結果為8。

在VC++ 6.0編譯器中,我們可以指定其對界方式(見圖1),其操作方式為依次選擇projetct &gt; setting &gt; C/C++菜單,在struct member alignment中指定你要的對界方式。

C/C+語言struct深層探索

<b>圖</b><b>1</b><b> 在</b><b>VC++ 6.0</b><b>中指定對界方式</b>

另外,通過__attribute((aligned (n)))也可以讓所作用的結構體成員對齊在n位元組邊界上,但是它較少被使用,因而不作詳細講解。

<b>2.3    </b><b>面試題的解答</b>

至此,我們可以對Intel、微軟的面試題進行全面的解答。

程式中第2行#pragma pack (8)雖然指定了對界為8,但是由于struct example1中的成員最大size為4(long變量size為4),故struct example1仍然按4位元組對界,struct example1的size為8,即第18行的輸出結果;

struct example2中包含了struct example1,其本身包含的簡單資料成員的最大size為2(short變量e),但是因為其包含了struct example1,而struct example1中的最大成員size為4,struct example2也應以4對界,#pragma pack (8)中指定的對界對struct example2也不起作用,故19行的輸出結果為16;

由于struct example2中的成員以4為機關對界,故其char變量c後應補充3個空,其後才是成員struct1的記憶體空間,20行的輸出結果為4。

<b>3.     </b><b>C</b><b>和</b><b>C++</b><b>間</b><b>struct</b><b>的深層差別</b>

在C++語言中struct具有了“類” 的功能,其與關鍵字class的差別在于struct中成員變量和函數的預設通路權限為public,而class的為private。

例如,定義struct類和class類:

class classB

      char a;

      …

則:

struct A a;

a.a = 'a';    //通路public成員,合法

classB b;

b.a = 'a';    //通路private成員,不合法

許多文獻寫到這裡就認為已經給出了C++中struct和class的全部差別,實則不然,另外一點需要注意的是:

C++中的struct保持了對C中struct的全面相容(這符合C++的初衷——“a better c”),因而,下面的操作是合法的:

//定義struct

int c;

structA a = {'a' , 'a' ,1};    //  定義時直接賦初值

即struct可以在定義的時候直接以{ }對其成員變量賦初值,而class則不能,在經典書目《thinking C++ 2ndedition》中作者對此點進行了強調。

<b>4.     </b><b>struct</b><b>程式設計注意事項</b>

看看下面的程式:

2. struct structA

3. {

4. int iMember;

5.  char *cMember;

6. };

7. int main(int argc, char* argv[])

8. {

9.  structA instant1,instant2;

10.char c = 'a';

11. instant1.iMember = 1;

12. instant1.cMember = &amp;c;

13.instant2 = instant1;

14.cout &lt;&lt; *(instant1.cMember) &lt;&lt; endl;

15.*(instant2.cMember) = 'b';

16. cout &lt;&lt; *(instant1.cMember) &lt;&lt; endl;

17. return 0;

14行的輸出結果是:a

16行的輸出結果是:b

Why?我們在15行對instant2的修改改變了instant1中成員的值!

原因在于13行的instant2 = instant1指派語句采用的是變量逐個拷貝,這使得instant1和instant2中的cMember指向了同一片記憶體,因而對instant2的修改也是對instant1的修改。

在C語言中,當結構體中存在指針型成員時,一定要注意在采用指派語句時是否将2個執行個體中的指針型成員指向了同一片記憶體。

在C++語言中,當結構體中存在指針型成員時,我們需要重寫struct的拷貝構造函數并進行“=”操作符重載。

 本文轉自 21cnbao 51CTO部落格,原文連結:http://blog.51cto.com/21cnbao/120795,如需轉載請自行聯系原作者

繼續閱讀