如果擷取的資料是HTML的話,我們就需要第三方工具有輔助擷取我們需要的資料。
我選用了HtmlAgilityPack這麼個工具。
首先肯定去網上下載下傳一個,然後引用到項目中。下載下傳位址:http://htmlagilitypack.codeplex.com/
HtmlAgilityPack提供很多方法。以下簡單介紹下。
//查找标簽://td
//查找class://div[@class=\"id_email\"]
//查找id://div[@id=\"id_email\"]
inode.NextSibling,相鄰節點
一般有class和id,應該基本夠用了。
注:在使用工具前,保證擷取的資料是HTML字元串。