码迷,mamicode.com
首页 > 编程语言 > 详细

python第二十天

时间:2019-05-09 23:55:33      阅读:264      评论:0      收藏:0      [点我收藏+]

标签:pytho   basic   日常   内容   format   deb   制表符   开始   需求   

 

标准三流

标准输入流:sys. stdin  # input的底层

标准输出流:sys. stdout     # print的底层

标准错误流:sys. stderr      # 异常及logging默认打印方式的底层

 

loggin模块
日志:记录日常的流水 => 将程序运行过程中的状态或数据进行记录,记录到日志文件中
import logging
logging配置:格式化输出 1)输出的方式 2)输出的格式 3)输出的位置
#基础配置如下:
logging.basicConfig(
filename=‘my_log.log‘,
filemode=‘w‘, #默认a追加
#stream = sys.stderr,  往控制台打印采用具体的输出流 ,只能往一个地方,要么文件,要么控台
format=‘%(asctime)s- %(name)s -%(levelname)s - %(module)s-%(message)s‘,
datefmt=‘%Y-%m-%d %H:%M:%S %p‘,
level=logging.INFO,) #  10,代表DEBUG及DEBUG级别以上都能输出

 

五个日志级别,级别本身没有代表信息重要性的级别,人为约定信息的级别。
可以设置级别,打印满足对应级别的信息
logging.info(‘info‘) #10
logging.debug(‘debug‘) #20
logging.warning(‘warning‘) #30
logging.error(‘error‘) #40
logging.critical(‘critical‘) #50

#不能将日志信息按不同的配置【日志格式,日志种类、等】写到不同的文件
#四大成员:
#1. logger对象
#2. filter 一种过滤规则
#3. handler控制输出的位置句柄,如往文件1、文件2..控制台
#4.formater输出的格式
‘‘‘
# 1.logger对象
logger1 = logging.getLogger(‘O_WEN‘) #不写默认是root

 


# 2.filter对象:过滤日志
‘‘‘
# 3.handler对象
fh1 = logging.FileHandler(‘a1.log‘, encoding=‘utf-8‘,) # 默认mode=‘a‘,
fh2 = logging.FileHandler(‘a2.log‘,encoding=‘utf-8‘)
ch = logging.StreamHandler()  #打印到控制台

# 4.formater 控制输出格式
formater1 = logging.Formatter(
fmt=‘%(asctime)s - %(name)s - %(levelname)s - %(module)s - %(message)s‘,
datefmt=‘%Y-%m-%d %H:%M:%S %p‘,)

formater2 = logging.Formatter(
fmt=‘%(asctime)s - %(levelname)s - %(message)s‘,
datefmt=‘%Y-%m-%d %H: %S %p‘,
)

# 5.绑定logger对象与handler对象
logger1.addHandler(fh1)
logger1.addHandler(fh2)
logger1.addHandler(ch)

# 6.绑定hgandler与formater
fh1.setFormatter(formater1)
fh2.setFormatter(formater1)
ch.setFormatter(formater2)

# 7.设置logger级别,有logger对象与handle对象两层关卡,必须都放行,最终才会放行执行
# 通常二者的级别相同
logger1.setLevel(10)
fh1.setLevel(10)
fh1.setLevel(10)
ch.setLevel(10)

#8使用logger对象产生日志
logger1.info(‘egon给owen转帐1000个亿美元‘)

 

‘‘‘

re模块

 

# re就是正则,是有语法的字符串,用来匹配目标字符串的

data = ‘https://www.baidu.com‘
# 案例1,判断该数据是否是合法的url链接
# 合法的url链接应该满足:以https:// 或 http:// 开头,并且以 com 或 cn 结尾
# 字符串匹配,根据你规定的字符串,与目标字符串进行配对,如果能配对成功,代表目标字符串满足需求
# 正则表达式:是一个可以同时制定多个规则的字符串

data = ‘https://www.baidu.com‘
res = re.findall(‘https://www.baidu.com‘,data) # (‘第一个参数是你所指定的字符串‘,‘第二个是目标字符串‘)
print(res)

 

单个字符匹配

 将目标字符串中的所有数字找出  \D 是\d的对立面,除了\d能找出的它都可以找出
data = ‘123zbc啦啦啦‘
res = re.findall(r‘\d‘,data) # \d 代表数字
print(res)


# 将目标字符串中的字母找出
res = re.findall(‘[a-z]‘,data) # [a-z] 表示,在a~z 中的所有字母,基于ascii码
print(res)


# re.I 是不区分大小写的匹配
print(re.findall(r‘a‘,‘abcABC123abcABC‘,flags=re.I)) # 输出结果为[‘a‘, ‘A‘, ‘a‘, ‘A‘]

# a|b | 符号表示或 此处表示a或b单个字符
print(re.findall(r‘a|b‘,‘abcABC123abcABC‘,flags=re.I)) # 输出结果为 [‘a‘, ‘b‘, ‘A‘, ‘B‘, ‘a‘, ‘b‘, ‘A‘, ‘B‘]

# [abc] a或,或b 或c 单个字符,与|符号不同,[]内可以添加多个字符
print(re.findall(r‘[abc]‘,‘abcABC123abcABC‘,flags=re.I))# 输出结果为[‘a‘, ‘b‘, ‘c‘, ‘A‘, ‘B‘, ‘C‘, ‘a‘, ‘b‘, ‘c‘, ‘A‘, ‘B‘, ‘C‘]

# [^ab]非a 及非b 的所有单个字符 取反,除了指定的字符,其他的都输出,
print(re.findall(r‘[^ab]‘,‘abcABC123abcABC‘)) # 输出结果 [‘c‘, ‘A‘, ‘B‘, ‘C‘, ‘1‘, ‘2‘, ‘3‘, ‘c‘, ‘A‘, ‘B‘, ‘C‘]

# [a-z],[A-Z],[0-9] 单个输出范围内的字符
print(re.findall(r‘[a-z]‘,‘abcABC123abcABC‘)) # 结果[‘a‘, ‘b‘, ‘c‘, ‘a‘, ‘b‘, ‘c‘]
print(re.findall(r‘[A-Z]‘,‘abcABC123abcABC‘)) # 结果[‘A‘, ‘B‘, ‘C‘, ‘A‘, ‘B‘, ‘C‘]
print(re.findall(r‘[0-9]‘,‘abcABC123abcABC‘)) # 结果[‘1‘, ‘2‘, ‘3‘]
# 可以组合使用
print(re.findall(r‘[0-9]|[A-Z]|[a-z]‘,‘abcABC123abcABC‘)) # 结果[‘a‘, ‘b‘, ‘c‘, ‘A‘, ‘B‘, ‘C‘, ‘1‘, ‘2‘, ‘3‘, ‘a‘, ‘b‘, ‘c‘, ‘A‘, ‘B‘, ‘C‘]
# 但是如果只是需要输出单个的数字,建议使用 \d
print(re.findall(r‘\d‘,‘abcABC123abcABC‘)) # 结果[‘1‘, ‘2‘, ‘3‘]

# \w == [a-zA-Z0-9]和一个_ 符号 而汉字也会理解为一个单个字母 而 \W 是\w的对立面
print(re.findall(r‘\w‘,‘abcABC123哈哈!@#$%^_‘)) # 结果[‘a‘, ‘b‘, ‘c‘, ‘A‘, ‘B‘, ‘C‘, ‘1‘, ‘2‘, ‘3‘, ‘哈‘, ‘哈‘, ‘_‘]

# \s 单个空的:空格,制表符,换页符 而\S 是\s的对立面
print(re.findall(r‘\s‘,‘\f\n\r\t\v‘)) # 结果 [‘\x0c‘, ‘\n‘, ‘\r‘, ‘\t‘, ‘\x0b‘]

# 单个汉字
print(re.findall(r‘[\u4e00-\u9fa5]‘,‘abc..123哈哈#¥#_‘)) # 结果[‘哈‘, ‘哈‘]

匹配多个字符
# . 会匹配除\n以外的所有单个字符
# print(re.findall(r‘.‘,‘@#$%^&*\n\t\r‘)) # \n没有输出[‘@‘, ‘#‘, ‘$‘, ‘%‘, ‘^‘, ‘&‘, ‘*‘, ‘\t‘, ‘\r‘]

# 而 re.S 可以让 . 匹配所有单个字符
# print(re.findall(r‘.‘,‘@#$%^&*\n\t\r‘,re.S)) # \n 可以输出了[‘@‘, ‘#‘, ‘$‘, ‘%‘, ‘^‘, ‘&‘, ‘*‘, ‘\n‘, ‘\t‘, ‘\r‘]



# 明确个数的重复
# {n}
# print(re.findall(r‘a‘,‘aaabbb‘)) # 输出结果[‘a‘, ‘a‘, ‘a‘]
#
# print(re.findall(r‘a{2}‘,‘aaabbb‘)) # 结果[‘aa‘] {}内是前面字符的个数
#
# print(re.findall(r‘ab‘,‘aabbabab‘)) # 结果[‘ab‘, ‘ab‘, ‘ab‘]
#
# print(re.findall(r‘a{2}b{2}‘,‘aabbaabbababab‘)) # 结果[‘aabb‘, ‘aabb‘]
#
# print(re.findall(r‘ab{2}‘,‘aabbababaabb‘)) # 结果[‘abb‘, ‘abb‘] {}内的个数,只对前一个字符有效

# {n,} 匹配n到无数个,被称为贪婪匹配,在下面案例中,优先匹配个数多的,然后依次递减,直至最少需求
# print(re.findall(r‘ab{2,}‘,‘abbababbabaabbabbbbbb‘)) # 结果[‘abb‘, ‘abb‘, ‘abb‘, ‘abbbbbb‘]

# {,n} 匹配0-n个,ab{,2} 优先匹配abb,没有ab也可以,如果ab也没有,有a也会匹配到
# print(re.findall(r‘ab{,2}‘,‘aababbabbabbbb‘)) # 结果[‘a‘, ‘ab‘, ‘abb‘, ‘abb‘, ‘abb‘]

# {n,m} 匹配n到m个,ab{1,3} 优先匹配最多的,然后依次递减,直到最后的字符
# print(re.findall(r‘ab{1,4}‘,‘aababbabbbabbbb‘)) # 结果[‘ab‘, ‘abb‘, ‘abbb‘, ‘abbbb‘]


# 特殊符号的重复
# *:匹配0-无数个
# print(re.findall(r‘ab*‘,‘aababbabbbabbbb‘)) # 结果[‘a‘, ‘ab‘, ‘abb‘, ‘abbb‘, ‘abbbb‘]

# +:匹配1到无数个
# print(re.findall(r‘ab+‘,‘aababbabbbabbbb‘)) # 结果[‘ab‘, ‘abb‘, ‘abbb‘, ‘abbbb‘]

# ?:匹配0到1个
# print(re.findall(r‘ab?‘,‘aababbabbbabbbb‘)) # 结果[‘a‘, ‘ab‘, ‘ab‘, ‘ab‘, ‘ab‘]

# 案例。匹配所有单词
# print(re.findall(r‘[a-z]+‘,‘abc def hello print‘)) # 结果[‘abc‘, ‘def‘, ‘hello‘, ‘print‘]

# 案列,包含c的所有字符
# print(re.findall(r‘[a-z]*c‘,‘abc def hello acb zc‘))


# \b代表单词边界,用空格(字符串的结尾也包括)作为匹配规则
# print(re.findall(r‘[a-z]+\b‘,‘abc def hello print‘)) # 结果[‘abc‘, ‘def‘, ‘hello‘, ‘print‘]
# 案例,以c字符结尾的字符
# print(re.findall(r‘[a-z]*c\b‘,‘abc def hello print acb zc‘)) # 结果[‘abc‘, ‘zc‘]
分组匹配
url = ‘http://www.baidu.com,http://www.youku.com‘
# 案例。要求拿到url的域名 baidu youku ()分组后,就之匹配出括号中的内容,其他不会输出
print(re.findall(r‘www.([a-z]+).com‘,url)) # 结果 [‘baidu‘, ‘youku‘]

# () 代表分组
# findall 匹配,如果匹配规则使用分组语法,只存放分组结果
print(re.findall(r‘(www).([a-z]+).com‘,url)) # 结果[(‘www‘, ‘baidu‘), (‘www‘, ‘youku‘)]

# 分组的顺序编号按照左边括号的前后顺序
print(re.findall(r‘(((w)ww).([a-z]+).com)‘,url)) # 结果 [(‘www.baidu.com‘, ‘www‘, ‘w‘, ‘baidu‘), (‘www.youku.com‘, ‘www‘, ‘w‘, ‘youku‘)]


# findall是全文匹配,可以从任意位置开始,匹配多次
# match非全文匹配,必须从头开始匹配,只能匹配一次

# 专门处理分组的方法:分组,分组编号,有名分组,取消分组
# 取消分组:必须写(),但是()为分组语法,我们只是想通过()将一些数据作为整体,所以必须加(),再取消分组
# (?:) 取消分组,只是作为整体 (?P<名字>)有名分组
url = ‘www.baidu.com,www.youku.com‘
res = re.match(r‘((?:www).(?P<name>[a-z]+).com)‘,url)
print(res.group(1)) # 括号内的参数是位置参数,指向第几个分组 结果# www.baidu.com
print(res.group(2)) # 结果 baidu
print(res.group(‘name‘)) # 结果 baidu
多行匹配
s = """http://www.baidu.com
https://sina.com.cn
https://youku.com
abchttp://www.oldboy.com
"""
# 如果想将url链接都匹配出来-> 使用分组 使用()后,只会输出()中的内容
print(re.findall(r‘(?:https://|https://).+(?:com|cn)‘, s))
# 判断以什么开头和结尾,使用分组组合判断,然后用?:来把分组功能解除,.是所有字符,而+号是相同字符出现的次数为无限个

# ^代表以什么开头,¥代表以什么结尾,必须结合flags = re.M来完成多行匹配
print(re.findall(r‘^http.+com$‘, s, re.M))

其他使用方法
# 拆分,用空格拆分
s = ‘a b ac def‘
print(s.split(‘ ‘))

# 正则拆分 中括号内加入你所需要分割的符号
s = ‘a b,ac@def‘
print(re.split(r‘[ ,@]‘, s))

# 正则替换,(‘目标字符‘,‘新字符‘,目标)
s = ‘python abc python‘
print(re.sub(‘python‘, ‘Python‘, s))

# 结合分组可以完成信息的重组与替换
s = ‘day a good!!!‘ # 新字符串 ‘a good good day!!!‘
print(re.sub(‘(day) (a) (good)‘, r‘today is \2 \3 \3 \1‘, s)) # 结果 today is a good good day!!!
# \数字表示它的顺序
正则匹配步骤
#  如果需要匹配\ 这个字符,字符串前面必须带r 和一个\ ,因为第一个\会做转义字符使用,
print(re.findall(r‘\\‘,‘a\d\c\\‘)) # 结果[‘\\‘, ‘\\‘, ‘\\‘]
# 而且 \b 是具有特殊意义的字符,在匹配\时,是匹配不到的,需要在目标字符串前加r 转成原义字符串
print(re.findall(r‘\\‘,r‘a\b\c\\‘)) # 结果[‘\\‘, ‘\\‘, ‘\\‘, ‘\\‘]

print(re.findall(r‘\n‘, ‘\n‘)) # [‘\n‘]
print(re.findall(r‘\d‘, ‘\d‘)) # []
print(re.findall(r‘\\d‘, ‘\d‘)) # [‘\\d‘]

re_obj = re.compile(r‘\n‘) # 转换成匹配换行符的正则对象
res = re_obj.findall(‘\n‘)
print(res) # [‘\n‘]

re_obj = re.compile(r‘\\d‘) # 转换成匹配 \d 的正则对象
res = re_obj.findall(‘\d‘)
print(res) # [‘\\d‘]

re_obj = re.compile(r‘\d‘) # 转换成匹配 数字 的正则对象
res = re_obj.findall(‘\d‘) # \d不是数字
print(res) # []

re_obj = re.compile(r‘\\n‘) # 转换成匹配 \n 的正则对象
res = re_obj.findall(‘\n‘) # 代表换行,不能被匹配
print(res) # []
res = re_obj.findall(r‘\n‘) # 就代表\n,能被匹配
print(res) # [‘\\n‘]
 


 

python第二十天

标签:pytho   basic   日常   内容   format   deb   制表符   开始   需求   

原文地址:https://www.cnblogs.com/liguodeboke/p/10841610.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!