将word转html的原理是这样的:
1、客户上传word文档到服务器
2、服务器调用openoffice程序打开上传的word文档
3、openoffice将word文档另存为html格式
4、over
至此可见,这要求服务器端安装openoffice软件,其实也可以是ms office,不过openoffice的优势是跨平台,你懂的。恩,说明一下,本文的测试基于 ms win7 ultimate x64 系统。
下面就是规规矩矩的实现。
1、下载openoffice,http://download.openoffice.org/index.html so easy...
2、下载jodconverter
http://www.artofsolving.com/opensource/jodconverter 这是一个开启openoffice进行格式转化的第三方jar包。
3、泡杯热茶,等待下载。
4、安装openoffice,安装结束后,调用cmd,启动openoffice的一项服务:c:\program files (x86)\openoffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"
5、打开eclipse
6、喝杯热茶,等待eclipse打开。
7、新建eclipse项目,导入jodconverter/lib 下得jar包。
* commons-io
* jodconverter
* juh
* jurt
* ridl
* slf4j-api
* slf4j-jdk14
* unoil
* xstream
8、coding...
类组织的不好,博友凑合看,代码注释比较详细了,不多说。
两个公开的方法是独立使用的,tohtmlstring(...)方法是转化文件并获取html代码,以备存入数据库。
参考了http://dangry.iteye.com/blog/858787,表示感谢。