标签:readline 使用 关键点 lin pytho 判断 遍历文件夹 获取 lis
I/O操作不仅包括屏幕输入输出,还包括文件的读取与写入,Python提供了很多必要的方法和功能,进行文件及文件夹的相关操作。本文主要通过两个简单的小例子,简述Python在文件夹及文件的应用,仅供学习分享使用,如有不足之处,还请指正。
定义一个方法get_file_size,获取单个文件的大小,单位有KB和MB两种。关键点如下所示:
1 def get_file_size(file_path, KB=False, MB=False): 2 """获取文件大小""" 3 size = os.path.getsize(file_path) 4 if KB: 5 size = round(size / 1024, 2) 6 elif MB: 7 size = round(size / 1024 * 1024, 2) 8 else: 9 size = size 10 return size
定义一个方法list_files,遍历指定文件目录,并存入字典当中。关键点如下所示:
1 def list_files(root_dir): 2 """遍历文件""" 3 if os.path.isfile(root_dir): # 如果是文件 4 size = get_file_size(root_dir, KB=True) 5 file_dict[root_dir] = size 6 else: 7 # 如果是文件夹,则遍历 8 for f in os.listdir(root_dir): 9 # 拼接路径 10 file_path = os.path.join(root_dir, f) 11 if os.path.isfile(file_path): 12 # 如果是一个文件 13 size = get_file_size(file_path, KB=True) 14 file_dict[file_path] = size 15 else: 16 list_files(file_path)
计算总大小和最大文件及最小文件,如下所示:
通过比较字典value的大小,返回对应的key的名称。关键点如下所示:
1 if __name__ == ‘__main__‘: 2 list_files(root_dir) 3 # print( len(file_dict)) 4 # 计算文件目录大小 5 total_size = 0 6 # 遍历字典的key 7 for file in file_dict: 8 total_size += file_dict[file] 9 10 print(‘total size is : %.2f‘ % total_size) 11 # 找最大最小文件 12 max_file = max(file_dict, key=lambda x: file_dict[x]) 13 min_file = min(file_dict, key=lambda x: file_dict[x]) 14 print(‘max file is : ‘, max_file, ‘\n file size is :‘, file_dict[max_file]) 15 print(‘min file is : ‘, min_file, ‘\n file size is :‘, file_dict[min_file])
两个文件内容,如下图所示:
定义一个函数read_book,用于读取两个文件的内容。关键点如下所示:
1 def read_book(): 2 """读取内容""" 3 # 读取一个文件 4 file1 = open(‘book1.txt‘, ‘r‘, encoding=‘UTF-8‘) 5 lines1 = file1.readlines() 6 file1.close() 7 for line in lines1: 8 line = line.strip() # 去空白 9 content = line.split(‘,‘) 10 book1[content[0]] = content[1] 11 12 # 另一种方式,读取另一个文件,不需要close,会自动关闭 13 with open(‘book2.txt‘, ‘r‘, encoding=‘UTF-8‘) as file2: 14 lines2 = file2.readlines() 15 for line in lines2: 16 line = line.strip() # 去空白 17 content = line.split(‘,‘) 18 book2[content[0]] = content[1]
定义一个函数,用于合并内容,并保存。关键点如下所示:
1 def merge_book(): 2 """合并内容""" 3 lines = [] # 定义一个空列表 4 header = ‘姓名\t 电话\t 文本\n‘ 5 lines.append(header) 6 # 遍历第一个字典 7 for key in book1: 8 line = ‘‘ 9 if key in book2.keys(): 10 line = line + ‘\t‘.join([key, book1[key], book2[key]]) 11 line += ‘\n‘ 12 else: 13 line = line + ‘\t‘.join([key, book1[key], ‘ *****‘]) 14 line += ‘\n‘ 15 lines.append(line) 16 # 遍历第2个,将不包含在第1个里面的写入 17 for key in book2: 18 line = ‘‘ 19 if key not in book1.keys(): 20 line = line + ‘\t‘.join([key, ‘ *****‘, book2[key]]) 21 line += ‘\n‘ 22 lines.append(line) 23 # 写入book3 24 with open(‘book3.txt‘, ‘w‘, encoding=‘UTF-8‘) as f: 25 f.writelines(lines)
整体调用,如下所示:
1 if __name__ == ‘__main__‘: 2 # 读取内容 3 read_book() 4 # 合并内容 5 merge_book() 6 7 # print(book1) 8 # print(book2)
最后拼接后生成的文件,如下所示:
通过以上两个例子,可以大致了解文件及目录操作的一些方法及步骤。
西江月·夜行黄沙道中
[宋]辛弃疾
明月别枝惊鹊,清风半夜鸣蝉。稻花香里说丰年,听取蛙声一片。
七八个星天外,两三点雨山前。旧时茅店社林边,路转溪桥忽见。
标签:readline 使用 关键点 lin pytho 判断 遍历文件夹 获取 lis
原文地址:https://www.cnblogs.com/hsiang/p/13126403.html