天天看点

借用OpenOffice将上传的Word文档转换成Html格式

将word转html的原理是这样的:

1、客户上传word文档到服务器

2、服务器调用openoffice程序打开上传的word文档

3、openoffice将word文档另存为html格式

4、over

至此可见,这要求服务器端安装openoffice软件,其实也可以是ms office,不过openoffice的优势是跨平台,你懂的。恩,说明一下,本文的测试基于 ms win7 ultimate x64 系统。

下面就是规规矩矩的实现。

1、下载openoffice,http://download.openoffice.org/index.html so easy...

2、下载jodconverter

http://www.artofsolving.com/opensource/jodconverter 这是一个开启openoffice进行格式转化的第三方jar包。

3、泡杯热茶,等待下载。

4、安装openoffice,安装结束后,调用cmd,启动openoffice的一项服务:c:\program files (x86)\openoffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"

借用OpenOffice将上传的Word文档转换成Html格式

5、打开eclipse

6、喝杯热茶,等待eclipse打开。

7、新建eclipse项目,导入jodconverter/lib 下得jar包。

 * commons-io

 * jodconverter

 * juh

 * jurt

 * ridl

 * slf4j-api

 * slf4j-jdk14 

 * unoil

 * xstream

8、coding...

类组织的不好,博友凑合看,代码注释比较详细了,不多说。

两个公开的方法是独立使用的,tohtmlstring(...)方法是转化文件并获取html代码,以备存入数据库。

参考了http://dangry.iteye.com/blog/858787,表示感谢。