码迷,mamicode.com
首页 > 编程语言 > 详细

初识python(四)

时间:2019-08-27 19:15:12      阅读:84      评论:0      收藏:0      [点我收藏+]

标签:一起   文件   模块   coding   tab   步骤   背景图   利用   jpg   

文本处理

什么是文件

文件是操作系统虚拟出来的概念,拿来存储信息的

什么是文本

.txt / .word / .md / .py 存储的是文字

文本处理

如何通过文本编辑器去控制txt文件

  • 找到路径
  • 打开文件
  • 读取/修改操作
  • 保存
  • 关闭文件
file_path = 'D:\pycharm_project\config.txt'
f = open(file_path, encoding='utf8')  # 把该路径的文件读入内存
data = f.read()      # 读取文件
print(data)
f.close()    # 解除对操作系统的占用

打开文件的三种操作

  • r 只读不可写
  • w 只写不可读(清空后写入)
  • a 只写不可读(末尾追加)
file_path = 'D:\pycharm_project\config.txt'
f = open(file_path, 'r',encoding='utf8')
print('f.readable:',f.readable())
print('f.writable:',f.writable())

# 打印结果:
f.readable: True
f.writable: False

写入文件

file_path = 'D:\pycharm_project\config.txt'
f = open(file_path, 'a',encoding='utf8')
data = f.write('234')
print(data)

文本处理高级应用

print(r'\n')  # \n本来是换行,加上r,变成了\n

gbk/utf8只针对文本,所以音频通过rb模式读取二进制

b模式下没有encoding模式,b一般与r / a / w 一起使用

file_path = 'D:\pycharm_project\movie.mp4'
f = open(file_path, 'rb')

r+可写可读,w+可写可读(清空文件),a+可写可读

一般不推荐使用可写可读模式

利用with open 可以自动关闭文件

with open('D:\pycharm_project\config.txt', 'r+', encoding='utf8') as f:
    data = f.read()
    print(data)   # 这个缩进里面的代码都是文件打开的状态,运行到缩进外面会自动关闭文件
print(123)

文本处理+词云

步骤:

  1. 读取文件内容
  2. 利用jieba模块对文件内容进行分割
  3. 找到一张词云图的背景图片
  4. 利用wordcloud模块生成词云图
import jieba
import wordcloud
import imageio

with open(r'D:\pycharm_project\day05\语录.txt','r',encoding='utf8') as f:
    data = f.read()
ls = jieba.lcut(data)
s = ' '.join(ls)

img = imageio.imread(r'D:\pycharm_project\上海老男孩python12期\预科班\33.jpg')
w = wordcloud.WordCloud(width=1000,height=1000,font_path=r'C:\Windows\Fonts\STXINWEI.TTF',background_color='white',mask=img)
w.generate(s)
w.to_file('qq.png')

技术图片

初识python(四)

标签:一起   文件   模块   coding   tab   步骤   背景图   利用   jpg   

原文地址:https://www.cnblogs.com/setcreed/p/11420109.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!