首页
Web开发
Windows程序
编程语言
数据库
移动开发
系统相关
微信
其他好文
会员
首页
>
其他好文
> 详细
如何把PDF文件内容转换成TXT
时间:
2016-06-16 20:01:07
阅读:
136
评论:
0
收藏:
0
[点我收藏+]
标签:
PDF格式文档的兴起使得现在很多文档都用PDF格式进行传递一些文档资料内容,如果拿到这种格式的文档,需要用到里面的一些文本内容,有些人就会进行复制粘贴了,但是如果需要的文本内容比较多,显然一页一页的复制操作是很浪费时间的,如果要将PDF文本内容提取出来可以直接将文件转换为txt格式就可以了。
一般我们查看PDF文件都会用的Adobe Reader,这个不仅可以查看PDF文档的内容,也能将里面的文本内容单独提取出来。所以在需要里面文本内容的时候就不需要再用复制粘贴的方法了。
首先用Adobe Reader打开文档,在“文件”菜单中选择“另存为其他”,然后选择“文本(X)”选项,就会弹出一个另存为对话框,直接点保存就可以了。
这种方法只适合提取里面的文本内容,对于像图片等其他类型的内容是无法提取出来的,而且转换成txt文本后,在排版上会与原来的PDF文件有些不同,有些内容的位置会出现错乱。
~~~~~
另外我们可以用转换文档格式的方法,把PDF格式转换成txt文本文档,这样也能把PDF里面的文本内容提取出来。这种方法转换的不同之处就是能使转换后的文档与原来PDF文件的排版保持一致,方便后来查看。
先打开
PDF转换器
,选择里面的文件转TXT,然后把PDF文件添加到转换工具列表中,并设置文档保存路径,最后点开始转换等待文档自动转换完成就可以了。
两种方法都可以把PDF文件中的文本内容输出到txt中,但是转换结果还是有些不同的,尤其是表格部分的内容尤为明显。这些可以通过对比发现两者的不同。
如何把PDF文件内容转换成TXT
标签:
原文地址:http://www.cnblogs.com/zencone/p/5591721.html
踩
(
0
)
赞
(
0
)
举报
评论
一句话评论(
0
)
登录后才能评论!
分享档案
更多>
2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)
周排行
更多
分布式事务
2021-07-29
OpenStack云平台命令行登录账户
2021-07-29
getLastRowNum()与getLastCellNum()/getPhysicalNumberOfRows()与getPhysicalNumberOfCells()
2021-07-29
【K8s概念】CSI 卷克隆
2021-07-29
vue3.0使用ant-design-vue进行按需加载原来这么简单
2021-07-29
stack栈
2021-07-29
抽奖动画 - 大转盘抽奖
2021-07-29
PPT写作技巧
2021-07-29
003-核心技术-IO模型-NIO-基于NIO群聊示例
2021-07-29
Bootstrap组件2
2021-07-29
友情链接
兰亭集智
国之画
百度统计
站长统计
阿里云
chrome插件
新版天听网
关于我们
-
联系我们
-
留言反馈
© 2014
mamicode.com
版权所有 联系我们:gaon5@hotmail.com
迷上了代码!