前面我們知道了如何通過執行heritrix官方提供的jar包去啟動heritrix,慶幸的是,heritrix是完全開源的,是以我們可以将heritrix的源碼直接導入eclipse去運作它。
首先解壓heritrix-1.14.4-src.zip到任意盤符,這裡我直接解壓到桌面,解壓後你會看到如圖的目錄結構:
src下毫無疑問是源碼檔案,lib是heritrix依賴的jar包。testdata檔案夾裡存放的是測試檔案,可以忽略。
将heritrix-1.14.4-src\src\java下的org,com,st3個目錄copy到剛建立的project的src下,
源碼複制進去後有很多代碼報錯,是因為我們還沒有添加jar依賴,首先在project裡建立一個folder取名lib用于存放依賴的第三方jar包,如圖:
将heritrix-1.14.4\lib下的所有jar包全部copy到剛剛建立的lib下,如圖:
選中全部jar,然後add to build path,如圖:
然後建立一個source folder取名為conf(名字随便取,不一定要叫conf),如圖:
将heritrix-1.14.4\src\conf下的所有檔案及檔案夾全部copy到建立的conf源碼檔案夾下,如圖:
然後繼續建立一個source folder 取名為resources,如圖:
然後resources下建立一個org. archive.util包,如圖:
然後将heritrix-1.14.4\src\resources\org\archive\util下的tlds-alpha-by-domain.txt檔案copy到剛剛建立的org.acchive.util包下,如圖:
然後将heritrix-1.14.4\src下的webapps整個目錄複制到目前project的根目錄下,如圖:
然後在eclipse中打開heritrix.properties配置檔案,稍作修改,如圖:
這一切工作完成後,在eclipse界面裡按下ctrl + shift + t,然後查找heritrix類,如圖:
然後你就可以滑鼠右鍵run as運作它來啟動heritrix啦,運作後如果你在控制台看到如圖的提示資訊,即表明heritrix啟動成功啦!
iteye不允許我貼我的qq和群号,要聯系我看之前的部落格吧,不然iteye又要封我部落格啦,坑爹的iteye!
轉載:http://iamyida.iteye.com/blog/2239775