天天看点

Eclipse下运行启动Heritrix1.14.4

前面我们知道了如何通过执行heritrix官方提供的jar包去启动heritrix,庆幸的是,heritrix是完全开源的,所以我们可以将heritrix的源码直接导入eclipse去运行它。

首先解压heritrix-1.14.4-src.zip到任意盘符,这里我直接解压到桌面,解压后你会看到如图的目录结构:

Eclipse下运行启动Heritrix1.14.4

 src下毫无疑问是源码文件,lib是heritrix依赖的jar包。testdata文件夹里存放的是测试文件,可以忽略。

Eclipse下运行启动Heritrix1.14.4

 将heritrix-1.14.4-src\src\java下的org,com,st3个目录copy到刚新建的project的src下,

Eclipse下运行启动Heritrix1.14.4

 源码复制进去后有很多代码报错,是因为我们还没有添加jar依赖,首先在project里新建一个folder取名lib用于存放依赖的第三方jar包,如图:

Eclipse下运行启动Heritrix1.14.4
Eclipse下运行启动Heritrix1.14.4

 将heritrix-1.14.4\lib下的所有jar包全部copy到刚刚新建的lib下,如图:

Eclipse下运行启动Heritrix1.14.4

 选中全部jar,然后add to build path,如图:

Eclipse下运行启动Heritrix1.14.4

 然后新建一个source folder取名为conf(名字随便取,不一定要叫conf),如图:

Eclipse下运行启动Heritrix1.14.4

 将heritrix-1.14.4\src\conf下的所有文件及文件夹全部copy到新建的conf源码文件夹下,如图:

Eclipse下运行启动Heritrix1.14.4
Eclipse下运行启动Heritrix1.14.4

 然后继续新建一个source folder 取名为resources,如图:

Eclipse下运行启动Heritrix1.14.4

 然后resources下新建一个org. archive.util包,如图:

Eclipse下运行启动Heritrix1.14.4
Eclipse下运行启动Heritrix1.14.4

 然后将heritrix-1.14.4\src\resources\org\archive\util下的tlds-alpha-by-domain.txt文件copy到刚刚新建的org.acchive.util包下,如图:

Eclipse下运行启动Heritrix1.14.4

 然后将heritrix-1.14.4\src下的webapps整个目录复制到当前project的根目录下,如图:

Eclipse下运行启动Heritrix1.14.4

 然后在eclipse中打开heritrix.properties配置文件,稍作修改,如图:

Eclipse下运行启动Heritrix1.14.4

 这一切工作完成后,在eclipse界面里按下ctrl + shift + t,然后查找heritrix类,如图:

Eclipse下运行启动Heritrix1.14.4

 然后你就可以鼠标右键run as运行它来启动heritrix啦,运行后如果你在控制台看到如图的提示信息,即表明heritrix启动成功啦!

Eclipse下运行启动Heritrix1.14.4

iteye不允许我贴我的qq和群号,要联系我看之前的博客吧,不然iteye又要封我博客啦,坑爹的iteye!

转载:http://iamyida.iteye.com/blog/2239775

继续阅读