解析文件. Win32 用户: 创建一个用来解析 Windows .ini 文件的程序. POSIX 用户:创建一个解析 /etc/serves 文件的程序. 其它平台用户: 写一个解析特定结构的系统配置文件的程序.
网上的例子多是解析 windows 的win.ini 的,这个相对简单些。
这里是解析/etc/services的,由于某些列(各列可以看做配置项)可能为空,需要对怎么取出各列和判断可能为空的列做些处理。
用dict存储解析结果:
dict的每个key的名字就是该行的第一列(服务名),这个key的value就是该行其他元素组成的list,且list的每个元素以 配置项名称 = 配置项值 的形式出现。
# coding:utf-8 import re # 把文件读取进来, 每行存放到list, 不断增加list元素, 注释行忽略 def file_analyze(fname): line_list = list() with open(fname, ‘r‘) as fd: for eachline in fd: if eachline.startswith(‘#‘): continue line_list.append(eachline) return line_list # 用一个dict存放解析结果, dict的每个元素是一个list, dict的每个key-value对是每行的解析结果 # 怎么区分每列呢?第一二列区分方法用空格 # 第四列用#分割出来就行 # 第三四列的区分方法是把每行去掉第四列后, 再去掉第一列和第二列 # 其中需要对第三列和第四列可能为空的情况做判断 # item就是文件的每行 def column_analyze(file_list): for item in file_list: line_analyze_list = list() service_name, tmp_port_protocol, port_protocol, aliases, comment = str(), str(), str(), str(), str() if len(item.strip(‘\n‘).strip(‘\s‘)) == 0: continue for unit in re.split(‘//s+‘, item): service_name = unit.split()[0] tmp_port_protocol = unit.split()[1].strip() port_protocol = ‘port_protocol = ‘ + unit.split()[1].strip() line_analyze_list.append(port_protocol) tmp_aliases = unit.split(‘#‘)[0].strip(service_name).lstrip(). strip(tmp_port_protocol) if len(tmp_aliases.strip()) == 0: aliases = ‘aliases = ‘ else: aliases = ‘aliases = ‘ + unit.split(‘#‘)[0]. strip(service_name). lstrip().strip(tmp_port_protocol).strip() line_analyze_list.append(aliases) if unit.find(‘#‘) < 0: comment = ‘comment = ‘ else: comment = ‘comment = ‘ + unit.split(‘#‘)[1].strip().strip(‘\n‘) line_analyze_list.append(comment) analyze_dict[service_name] = line_analyze_list return analyze_dict def main(fname, listname): listname = file_analyze(fname) analyze_dict = column_analyze(listname) if __name__ == ‘__main__‘: analyze_list = list() analyze_dict = dict() file_name = ‘/etc/services‘ main(file_name, analyze_list) print analyze_dict
本文出自 “linux与网络那些事” 博客,请务必保留此出处http://khaozi.blog.51cto.com/952782/1896307
原文地址:http://khaozi.blog.51cto.com/952782/1896307