码迷,mamicode.com
首页 > 编程语言 > 详细

python从word中取得完整的内容

时间:2019-08-23 13:29:13      阅读:116      评论:0      收藏:0      [点我收藏+]

标签:ttext   filename   完整   文本   graph   for   ret   def   file   

#只关心word文档中的文本,不关心样式信息,就可以利用getText()函数
import docx
def getText(filename):
  doc=docx.Document(filename)
  fullText=[]
  for para in doc.paragraphs:
    fullText.append(para.text)
  return ‘\n‘.join(fullText)
print(getText(‘example.docx‘))
#下面的代码可以实现同样的功能
doc2=docx.Document(‘example.docx‘)
#paragraphs是paragraph对象的列表 所以下面这个会显示数字
for i in range(0,len(doc2.paragraphs)):#获取段落的数量
  print(doc2.paragraphs[i].text)#text显示段落的文本

python从word中取得完整的内容

标签:ttext   filename   完整   文本   graph   for   ret   def   file   

原文地址:https://www.cnblogs.com/shunguo/p/11399299.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!