puts mechanize::agent_aliases 可以列印出所有可用的user_agent
puts mechanize.<code>instance_methods(false)</code> 輸出mechanize子產品的所有方法
puts mechanize.instance_methods()
輸出mechanize子產品的所有方法以及所繼承的類的函數
ruby中實作網頁抓取,一般用的是,使用非常簡單。
安裝
抓取網頁
模拟點選事件
模拟表單送出
分析頁面,mechanize用的是解析網頁的,是以可以參照的文檔
有幾點注意的地方: 如果需要先登入的網頁,那麼可以在網站先登入,登入後記錄jsessionid,然後指派給agent
如果需要儲存網頁,使用.save_as,(或許save也可以,我沒試過)例如
轉載自:http://www.cnblogs.com/stoned/archive/2012/02/23/2364389.html