.NET大牛之路 • 王亮@精緻碼農 • 2021.08.27
前面我們講到 .NET 平台支援的兩大資料類型:值類型和引用類型。值類型比引用類型更高效,因為它沒有指針引用,不用配置設定在托管堆中,也不用被 GC 回收。但有時候你可能偶爾需要将一種類型的變量表示為另一種類型的變量。為此,C# 提供了裝箱和拆箱的機制。
1了解裝箱
簡單地說,裝箱就是将一個值類型的資料存儲在一個引用類型的變量中。
假設你一個方法中建立了一個
int
類型的本地變量,你要将這個值類型表示為一個引用類型,那麼就表示你對這個值進行了裝箱操作,如下所示:
static void SimpleBox()
{
int myInt = 25;
// 裝箱操作
object boxedInt = myInt;
}
确切地說,裝箱的過程就是将一個值類型配置設定給
Object
類型變量的過程。當你裝箱一個值時,CoreCLR 會在堆上配置設定一個新的對象,并将該值類型的值複制到該對象執行個體。傳回給你的是一個在托管堆中新配置設定的對象的引用。
2了解拆箱
反過來,将
Object
引用類型變量的值轉換回棧中相應的值類型的過程則稱為拆箱。
從文法上講,拆箱操作看起來就像一個正常的轉換操作。然而,其語義是完全不同的。CoreCLR 首先驗證接收的資料類型是否等同于被裝箱的類型,如果是,它就把值複制回基于棧存儲的本地變量中。
例如,如果下面的
boxedInt
的底層類型确實是
int
,那就完成了拆箱操作:
static void SimpleBoxUnbox()
{
int myInt = 25;
// 裝箱操作
object boxedInt = myInt;
// 拆箱操作
int unboxedInt = (int)boxedInt;
}
記住,與執行典型的類型轉換不同,你必須将其拆箱到一個恰當的資料類型中。如果你試圖将一塊資料拆箱到不正确的資料類型中,将會抛出
InvalidCastException
異常。為了安全起見,如果你不能保證
Object
類型背後的類型,最好使用
try/catch
邏輯把拆箱操作包起來,盡管這樣會有些麻煩。考慮下面的代碼,它将抛出一個錯誤,因為你正試圖将裝箱的
int
類型拆箱成一個
long
類型:
static void SimpleBoxUnbox()
{
int myInt = 25;
// 裝箱操作
object boxedInt = myInt;
// 拆箱到錯誤的資料類型,将觸發運作時異常
try
{
long unboxedLong = (long)boxedInt;
}
catch (InvalidCastException ex)
{
Console.WriteLine(ex.Message);
}
}
3生成的 IL 代碼
當 C# 編譯器遇到裝箱/拆箱文法時,它會生成包含裝箱/拆箱操作的 IL 代碼。如果你用
ildasm.exe
檢視編譯的程式集,你會看到裝箱和拆箱操作對應的
box
和
unbox
指令:
.method assembly hidebysig static
void '<<Main>$>g__SimpleBoxUnbox|0_0'() cil managed
{
.maxstack 1
.locals init (int32 V_0, object V_1, int32 V_2)
IL_0000: nop
IL_0001: ldc.i4.s 25
IL_0003: stloc.0
IL_0004: ldloc.0
IL_0005: box [System.Runtime]System.Int32
IL_000a: stloc.1
IL_000b: ldloc.1
IL_000c: unbox.any [System.Runtime]System.Int32
IL_0011: stloc.2
IL_0012: ret
} // end of method '<Program>$'::'<<Main>$>g__SimpleBoxUnbox|0_0'
乍一看,裝箱/拆箱似乎是一個沒啥用的語言特性,學術性大于實用性。畢竟,你很少需要在一個本地
Object
變量中存儲一個本地值類型。然而,事實是裝箱/解箱過程是相當有用的,因為它允許你假設一切都可以被當作
Object
類型來處理,而 CoreCLR 會自動幫你處理與記憶體有關的細節。
4實際應用
讓我們來看看裝箱/拆箱的實際應用,我們以 C# 的
ArrayList
類為例,用它來儲存一批在棧中存儲的整型資料。
ArrayList
類的相關方法成員列舉如下:
public class ArrayList : IList, ICloneable
{
...
public virtual int Add(object? value);
public virtual void Insert(int index, object? value);
public virtual void Remove(object? obj);
public virtual object? this[int index] { get; set; }
}
請注意,上面
ArrayList
的方法都是對
Object
類型資料進行操作。
ArrayList
是為操作對象(代表任何類型)而設計的,而對象是在托管堆上配置設定的資料。請考慮下面代碼:
static void WorkWithArrayList()
{
// 當傳遞給對象的方法時,值類型會自動被裝箱
ArrayList myInts = new ArrayList();
myInts.Add(10);
}
盡管你直接将數字資料傳入需要
Object
參數的方法中,但運作時自動将配置設定在棧中的資料裝箱。如果你想使用索引器從
ArrayList
中檢索一條資料,你必須使用轉換操作将堆配置設定的對象拆箱為棧配置設定的整型,因為
ArrayList
的索引器傳回的是
Object
類型,而不是
int
類型。
static void WorkWithArrayList()
{
// 當傳遞給需要對象參數的方法時,值類型就自動被裝箱
ArrayList myInts = new ArrayList();
myInts.Add(10);
// 當對象被轉換回基于棧存儲的資料時,就會發生拆箱
int i = (int)myInts[0];
// 由于 WriteLine() 需要的 object 參數,又重新裝箱了
Console.WriteLine("Value of your int: {0}", i);
}
在調用
ArrayList.Add()
之前,在棧中配置設定的
int
數值被裝箱了,是以它可以被傳入參數為
Object
類型的方法中。從
ArrayList
中檢索到
Object
類型的資料時,通過轉換操作,它就被拆箱成
int
類型。最後,當它被傳遞給
Console.WriteLine()
方法時,又被裝箱了,因為這個方法的參數是
Object
類型。
5小結
從程式員的角度來看,裝箱和拆箱是很友善的,我們不需要手動去複制和轉移記憶體中的值類型和引用類型的資料。
但裝箱和拆箱背後的棧/堆記憶體轉移也帶來了性能問題。下面總結一下對一個簡單的整型數進行裝箱和拆箱所需要的步驟:
- 在托管堆中配置設定一個新對象;
- 在棧中的資料值被轉移到該托管堆中的對象上;
- 當拆箱時,存儲在堆中對象上的值被轉移回棧中;
- 堆上未使用的對象将最終被 GC 回收。
盡管很多時候裝箱和拆箱操作不會在性能方面造成重大影響,但如果一個像
ArrayList
這樣的集合包含成千上萬條資料,而你的程式又會頻繁操作這些資料,性能的影響還是會很明顯的。
是以,我們平時在程式設計時應當盡量避免發生裝箱和拆箱操作。比如對于上面
ArrayList
的示例,如果集合元素類型是一緻的,則應當使用泛型的集合類型,比如改用
List<T>
、
LinkedList<T>
等。