天天看點

Ruby:Mechanize的使用教程

puts mechanize::agent_aliases 可以列印出所有可用的user_agent

puts mechanize.<code>instance_methods(false)</code> 輸出mechanize子產品的所有方法

puts mechanize.instance_methods()  

輸出mechanize子產品的所有方法以及所繼承的類的函數

ruby中實作網頁抓取,一般用的是,使用非常簡單。

安裝

抓取網頁

模拟點選事件

模拟表單送出

分析頁面,mechanize用的是解析網頁的,是以可以參照的文檔

有幾點注意的地方: 如果需要先登入的網頁,那麼可以在網站先登入,登入後記錄jsessionid,然後指派給agent

如果需要儲存網頁,使用.save_as,(或許save也可以,我沒試過)例如

轉載自:http://www.cnblogs.com/stoned/archive/2012/02/23/2364389.html