天天看點

經驗總結22--抓取HTML資料,HtmlAgilityPack(續)

如果擷取的資料是HTML的話,我們就需要第三方工具有輔助擷取我們需要的資料。

我選用了HtmlAgilityPack這麼個工具。

首先肯定去網上下載下傳一個,然後引用到項目中。下載下傳位址:http://htmlagilitypack.codeplex.com/

HtmlAgilityPack提供很多方法。以下簡單介紹下。

//查找标簽://td

                //查找class://div[@class=\"id_email\"]

                //查找id://div[@id=\"id_email\"]

inode.NextSibling,相鄰節點

一般有class和id,應該基本夠用了。

注:在使用工具前,保證擷取的資料是HTML字元串。