天天看点

poi将html文件转为docx,java使用POI实现html和word相互转换.pdf

java使使用用POI实实现现html和和word相相互互转转换换

项目后端使用了springboot,maven,前端使用了ckeditor富文本编辑器。目前从html转换的word为doc格式,而图片 理支持的

是docx格式,所以需要手动把doc另存为docx,然后才可以进行图片替换。

一一.添添加加maven依依赖赖

主要使用了以下和poi相关的依赖,为了便于获取html的图片元素,还使用了jsoup:

org.apache.poi

poi

3.14

org.apache.poi

poi-scratchpad

3.14

org.apache.poi

poi-ooxml

3.14

fr.opensagres.xdocreport

xdocreport

1.0.

org.apache.poi

poi-ooxml-schemas

3.14

org.apache.poi

ooxml-schemas

1.3

org.jsoup

jsoup

1.11.3

二二.word转转换换为为html

在springboot项目的resources目录下新建static文件夹,将需要转换的word文件temp.docx粘贴进去,由于static是springboot的

默认资源文件,所以不需要在配置文件里面另行配置了,如果改成其他名字,需要在application.yml进行相应配置。

doc格式转换为html:

public static String docToHtml() throws Exception {

File path = new File(ResourceUtils.getURL("classpath:").getPath());

String imagePathStr = path.getAbsolutePath() + "\\static\\image\\";

String sourceFileName = path.getAbsolutePath() + "\\static\\test.doc";

String targetFileName = path.getAbsolutePath() + "\\static\\test2.html";

File fil