其實在09年就已經學習過Linq了,并被她那優美的文法所吸引,隻是現在所在的公司還在使用VS2005在.Net2.0的架構下面的開發,是以Linq也很久沒有用過了,最近看部門的同僚對這個有些興趣,是以打算整理點東西出來跟大家一起做個分享。
LINQ是Language Integrated Query的簡稱,它是內建在.NET程式設計語言中的一種特性。已成為程式設計語言的一個組成部分,在編寫程式時可以得到很好的編譯時文法檢查,豐富的中繼資料,智能感覺、靜态類型等強類型語言的好處。并且它同時還使得查詢可以友善地對記憶體中的資訊進行查詢而不僅僅隻是外部資料源。
Linq包括Linq to Objects, Linq to SQL,Linq to XML, Linq to DataSet等,本篇從Linq to Objects開始了解Linq的皮毛。
顧名思義就是對現有類進行擴充的的方法,擴充方法可以在不修改現有類的情況下,為現有類增加公共的接口(不是C#中的interface)。
擴充方法本質上是一個靜态方法,不同之處在于它的第一個參數必須有this關鍵字聲明,并且第一個參數的類型即為要擴充的類型。如
這裡是個簡單的将字元串轉為double類型的擴充方法,隻要引用了該方法的命名空間,則都可以直接用string類型來調用ToDouble方法。
擴充方法是後文的基礎,C#3.0中的Linq的實作都是基于擴充方法,通過對IEnumerable<T>接口(Linq to Objects)的擴充和對IQueryable<T>的擴充來實作Linq的相關功能,而Linq的相關關鍵字最終都是轉化為對IEnumerable<T>(IQueryable<T>)的調用。
lambda表達式其實就是.net2.0中的匿名方法,然後再3.0中以一種更優美的姿态呈現出來。
lambda表達式的基本文法為
(參數清單) =>{語句塊;} 或者
( 參數清單) =>表達式
當參數清單中隻有一個參數的時候,圓括号可以省略
使用與可以由編譯器推導出的變量的聲明,不需要顯式指定對象的類型。
上例中由于定義中已經指明了對象的類型,聲明中已經完全沒有必要使用顯示的類型定義,是以可以使用var關鍵字。
對于匿名對象
由于無法用一個類型類聲明匿名對象,此時可以用var是聲明。
注意var隻是省下了顯式聲明的過程,而C#本身就是靜态語言,是以var所聲明的變量的類型已經确定任然是不能改變的,亦即,var并非是變體類型。
linq的文法通過System.Linq下面的Enumerable類提供支援,通過觀察他的簽名,你就會發現他為IEnumerable<T>實作了一系列的擴充方法,也就是說,隻要是實作了IEnumerable<T>的對象都可以使用Linq的文法來查詢。
而對于隻實作了IEnumerable接口而沒有實作IEnumerable<T>的對象可以通過
public static IEnumerable<TResult> Cast<TResult>(this IEnumerable source);
來将IEnumerable接口轉為IEnumerable<T>(例如ArrayList)。
在C#3.0中,為Linq引入了一些新的關鍵字,他們是:
from join where group into let orderby select
熟悉Sql的同學看着是不是有些眼熟呢,其實在Linq中他們的涵義和在SQL中類似的,是以會很容易了解的。接下來的時間,簡單介紹下這些關鍵字的使用。
from子句是一個Linq查詢的開始,任何一個Linq語句都是以from開始,from子句指定查詢的容器,和在此語句有效的局部變量(用來指定容器中的一項,from子句的效果很類似于foreach)。from子句的文法為
local就是在此Linq語句中的局部變量,由于container必須為IEnumerable<T>,他的類型可以由container推導出來(即T)。上一段簡單的例子:
輸出
如果container僅僅實作IEnumerable而沒有實作IEnumerable<T>,則需要顯式指定局部變量的類型,或者是使用Cast轉為IEnumerable<T>
對查詢的結果進行投影,在子句中指定要選擇的列,如上例。
有的時候,我們隻需要投影某一列,我們可以這樣
我們還可以指定要投影的列的集合,這個時候我們要用到匿名類型
query中的每一項都時候一個擁有ID屬性和Name屬性的對象,當然有的時候實體的屬性名不是我們想要的,或者是通過對屬性計算得來的,那麼我們可以顯式指定屬性名,就像下面這樣:
對容器内的資料進行篩選。
類似SQL裡的join,Linq中的join子句用于将兩個容器的資料以某種關系進行關聯。
值得注意的是join子句隻能使用equals或者是not equal而不能用其他運算符(==都不行)。而equals運算符左邊必須聯接的左部,右邊為右部,不能調換的,否則編譯不能通過。
into子句用于将join或者是group子句的結果進一步持續化,包裝成為一個
System.Linq.IGrouping<TKey, TElement>
對象,而且IGrouping繼承自IEnumerable<TElement>,可以看出,IGrouping接口提供分組的鍵和,該鍵下所包含的集合。例子見group
對結果按照指定的條件進行分組
例子示範了通過姓名的長度對一個姓名清單進行分組,并将分組的結果保持到局部變量g中,可以通過下面的代碼将query的結果輸出
let子句用于在查詢中添加一個新的局部變量,使其在後面的查詢中可見
用于選取前XX個或者和跳過前XX個,如選擇第11到20個則可以
排序而已
Distinct Union Intersect Except 這些單詞都見過吧,分别就是取不重複,并集,交集,差集(這個貌似看看參數就明白了)
其他擴充都在Enumerable類下面了。
Linq查詢的執行結果是IEnumerable<T>類型,而對IEnumerable<T>,在内部,C#通過yield關鍵字實作疊代器達到延遲加載的目的。進而使Linq查詢隻是在需要的時候才會被執行。
但是,某一些擴充方法在執行時會試圖周遊整個容器,進而使延遲加載無效,如排序,聚合函數(Count,Sum,Average等。)
這裡有個簡單的例子來證明,當使用Take時候,Linq語句能正常的執行,而當我們再Linq上使用一個Order By之後,程式就卡死了,當然,這是理所應當的,在失去延遲加載的特性之後,試圖對一個無窮序列排序的結果一定是outOfMemory。
這都隻是皮毛,感興趣的同學可以自己去MSDN檢視更詳細的資料,最後,推薦一個工具和一個網站: