最近有个需求,是把doc文档转换成html文件。 Microsoft office 本身有自带另存为 .html文件的方式,但是导出来的网页文件,有很多冗余的代码。 于是注意到工具 mammoth.js
在mammoth.js 的说明文档里,有一个简易的演示,具体操作如下:
web demo
第一步:clone项目,没有问题。
代码语言:javascript复制git clone https://github.com/mwilliamson/mammoth.js.git
第二步:运行make setup
。这个是要执行项目中的makefile文件里面的setup目标(即make会按照Makefile里的指令完成构建 一般就是编译打包之类的操作)。
makefile
但是window系统没有make指令,所以只能手动处理下。按照makefile的构建过程,整理处理就是一下三个动作:
代码语言:javascript复制# 按照项目中package.json 的依赖包
npm install
# 获取mammoth.browser.js到当前目录
node_modules/.bin/browserify lib/index.js --standalone mammoth -p browserify-prepend-licenses > mammoth.browser.js
# 获取mammoth.browser.min.js到当前目录
node_modules/.bin/uglifyjs mammoth.browser.js -c > mammoth.browser.min.js
在git bash中分别执行上面三个动作,即完成了 make setup
.
第三部:打开index.html,然后上传docx文档,就可以在页面上看到转换后的结果。当然标签设置还不是很完美,但已初现雏形。
效果图
ps:关于mamoth.js的使用,英文渣渣的我,还一头雾水。希望其他小伙伴有使用心得总结的,也可以一起分享交流。