通过libreoffice工具转换成pdf
这个在windows实现 下载好就行 跟平常的软件一个用法
图片没上传上去抱歉、、
打开
保存到你要保存的目录
参见github
https://github.com/coolwanglu/pdf2htmlEX/wiki/Download
从Docker容器运行是将pdf文件转换为html的最简单的方法,您不需要知道如何编译和安装pdf2htmlEX。
因为pdf2htmlEX 安装太麻烦了依赖太多
系统centos6.8
yum install -y docker-io /etc/init.d/docker start
假设你有一个PDF文件/ pdf / test.pdf,只需运行
docker run -ti --rm -v ~/pdf:/pdf bwits/pdf2htmlexpdf2htmlEX --zoom 1.3 test.pdf
将test.html在~/pdf目录中生成一个HTML文件。
首次执行会从仓库拉一个镜像下来等待时间较长
[root@lanyezi ~]# docker images REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE bwits/pdf2htmlex latest bacf7f15f6e6 23 monthsago 245.6 MB
设置一个软连接。。docker运行容器然后执行对应的命令
alias pdf2htmlEX=‘docker run -ti --rm -v `pwd`:/pdfbwits/pdf2htmlex pdf2htmlEX‘ pdf2htmlEX -h pdf2htmlEX --zoom 1.3 test.pdf
有关如何安装docker的详细信息,请参阅https://docs.docker.com/installation/
有关如何运行pdf2htmlEX的详细信息,请阅读维基
https://github.com/coolwanglu/pdf2htmlEX/wiki/Quick-Start
强烈建议您安装ttfautohint并随时添加--external-hint-tool=ttfautohint以下每个配方。此工具可以增强Windows上所有浏览器的字体渲染。
仔细检查您是否poppler-data安装了CJK字符。
仔细检查你已经运行sudo make install,或者pdf2htmlEX可能无法正确执行
最简单的情况
假设你有一个PDF文件pdf/test.pdf,只需运行
pdf2htmlEX命令是上文通过docker做的软连接容器
pdf2htmlEX --zoom 1.3 pdf/test.pdf
将test.html在当前目录中生成一个HTML文件。
pdf2htmlEX -f 3 -l 5 --fit-width 1024 --bg-formatjpg pdf/test.pdf
将仅转换第3,4页和第页,并将页宽调整为1024像素。背景图像将以JPEG格式生成。
pdf2htmlEX --embed cfijo --dest-dir outpdf/test.pdf
将test.html在out目录中产生一个和附带的文件,以这种方式将所有资源(字体,图像,CSS和JavaScript)存储在分离的文件中,以便查看器可以更好地利用浏览器缓存。
pdf2htmlEX --embed cfijo --split-pages 1 --dest-dirout --page-filename test-%d.page pdf/test.pdf
将执行类似的操作,但每个单独的页面都存储在一个单独的文件中。命令行中指定的文件名称等test-0.page,test-1.page依此类推。仍然有一个test.html通过ajax动态加载页面。以这种方式,发布商被完全控制,谁可以按照他们喜欢的方式组织页面,例如实现延迟页面加载。
pdf2htmlEX --fallback 1 pdf/test.pdf
也会产生一个单一的test.html,然而,它包括图像和隐藏的文本。这种模式提供最大的精度和兼容性,代价是更大的文件大小。仅当pdf2htmlEX无法正确处理您的文件时,才能使用此模式。
只要记住man pdf2htmlEX,pdf2htmlEX --help永远是你最好的朋友。
本文出自 “蓝叶子_架构” 博客,请务必保留此出处http://dellinger.blog.51cto.com/12445009/1969811
原文地址:http://dellinger.blog.51cto.com/12445009/1969811