码迷,mamicode.com
首页 > 其他好文 > 详细

pdf转word出现很多换行符将一整行切断

时间:2020-05-12 17:10:09      阅读:291      评论:0      收藏:0      [点我收藏+]

标签:注意   str   手工   换行   ima   中文   图片   使用   style   

一般手工判断是否是一行,主要依据是行尾是否由“句号+换行符”组成, 而pdf转换成word多出的换行符,通常不带句号

因此,使用以下三步搞定:

1)使用文档中未出现过的特殊字符(如“&&&&&&”)替换文章中的“句号+换行符”

技术图片

 

 

 

2)使用空格替换文章中多余的换行符

技术图片

 

 

 

3)使用“句号+换行符” 替换 特殊字符(如“&&&&&&”)

技术图片

 

 

注意:

1) ^p匹配换行符

2)文中截图中  “. ”匹配的是英文状态下的句号,如果是中文句号结尾,则应写成 “。”

3)特殊字符的选择原则是:文章中未出现过

 

pdf转word出现很多换行符将一整行切断

标签:注意   str   手工   换行   ima   中文   图片   使用   style   

原文地址:https://www.cnblogs.com/taoyuanming/p/12877020.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!