1、导入模块
Python之所以应用越来越广泛,在一定程度上也依赖于其为程序员提供了大量的模块以供使用,如果想要使用模块,则需要导入。导入模块有一下几种方法:
1. import module
2. from moudule.xxx.xxx import xx
3. from module.xxx.xxx import xx as xxx
4. from module.xxx.xxx import *
导入模块其实就是告诉Python解释器去解释那个py文件
- 导入一个py文件,解释器解释该py文件
- 导入一个包,解释器解释该包下的 __init__.py 文件
2、时间模块time/datetime
>>> time.altzone #当前时间转为夏令时区差值
-32400
>>> 32400/3600
9.0
>>> time.asctime() / time.ctime()
‘Wed Dec 13 15:07:24 2017‘
>>> time.localtime()
time.struct_time(tm_year=2017, tm_mon=12, tm_mday=13, tm_hour=15, tm_min=7, tm_sec=54, tm_wday=2, tm_yday=347, tm_isdst=0)
tm_wday:一个星期的第几天 (从星期一开始为0)
tm_isdst: 是否使用夏令时区, 0表示没有
时间字符串 =====> 时间戳
>>> import time
>>> str = "2016/05/22"
>>> string_2_struct = time.strptime(str,"%Y/%m/%d") # 日期字符串 ====> struct时间对象格式
>>> string_2_struct
time.struct_time(tm_year=2016, tm_mon=5, tm_mday=22, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=6, tm_yday=143, tm_isdst=-1)
>>> struct_2_stamp = time.mktime(string_2_struct) # struct时间对象格式 ====> 时间戳
>>> struct_2_stamp
1463846400.0
时间戳 =====> 时间字符串
>>> stamp_2_struct = time.gmtime(struct_2_stamp) # 时间戳 ====> struct_time格式
>>> stamp_2_struct
time.struct_time(tm_year=2016, tm_mon=5, tm_mday=21, tm_hour=16, tm_min=0, tm_sec=0, tm_wday=5, tm_yday=142, tm_isdst=0)
>>> time.strftime("%Y-%m-%d %H:%M:%S",stamp_2_struct) # struct_time格式 ====> 字符串格式
‘2016-05-21 16:00:00‘
import datetime
>>> str_time = datetime.datetime.now() # 获取当前时间
>>> str_time
datetime.datetime(2017, 12, 13, 14, 50, 27, 265392)
>>> datetime.date.fromtimestamp(time.time()) # 时间戳 转 日期格式
datetime.date(2017, 12, 13)
更改时间操作:datetime.timedelta(x) # x 默认是天/ hours=3 / minutes=30 当前时间基础上加、减
>>> str_time + datetime.timedelta(3)
datetime.datetime(2017, 12, 16, 14, 50, 27, 265392)
# 时间替换replace
str_time.replace(minute=3,hour=2)
datetime.datetime(2017, 12, 13, 2, 3, 27, 265392)
随机数
>>> import random
>>> random.random() # 生成随机数
0.34855893809643523
>>> random.randrange(1,10) # range(1,10)之间生成随机数
4
>>> random.randint(1,2) # 从1,2之间生成整数(包括2)
1
###########################
实例:随机码
import random
checkcode = ""
for i in range(4):
current = random.randrange(0,4)
if current != i:
temp = chr(random.randint(65,90))
else:
temp = random.randint(0,9)
checkcode += str(temp)
print(checkcode)
############################
ord()函数主要用来返回对应字符的ascii码
chr()主要用来表示ascii码对应的字符他的输入时数字,可以用十进制,也可以用十六进制。
>>> chr(80)
‘P‘
>>> ord(‘P‘)
80
3、OS模块
提供对操作系统进行调用的接口
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir(
"dirname"
) 改变当前脚本工作目录;相当于shell下cd
os.curdir 返回当前目录: (
‘.‘
)
os.pardir 获取当前目录的父目录字符串名:(
‘..‘
)
os.makedirs(
‘dirname1/dirname2‘
) 可生成多层递归目录
os.removedirs(
‘dirname1‘
) 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir(
‘dirname‘
) 生成单级目录;相当于shell中mkdir dirname
os.rmdir(
‘dirname‘
) 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir(
‘dirname‘
) 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove() 删除一个文件
os.rename(
"oldname"
,
"newname"
) 重命名文件
/
目录
os.stat(
‘path/filename‘
) 获取文件
/
目录信息
os.sep 输出操作系统特定的路径分隔符,win下为
"\\",Linux下为"
/
"
os.linesep 输出当前平台使用的行终止符,win下为
"\r\n"
,Linux下为
"\n"
os.pathsep 输出用于分割文件路径的字符串
os.name 输出字符串指示当前使用平台。win
-
>
‘nt‘
; Linux
-
>
‘posix‘
x = os.system(
"bash command"
) 运行shell命令,直接显示, x返回的是执行后的状态码
os.environ 获取系统环境变量
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path) 如果path存在,返回
True
;如果path不存在,返回
False
os.path.isabs(path) 如果path是绝对路径,返回
True
os.path.isfile(path) 如果path是一个存在的文件,返回
True
。否则返回
False
os.path.isdir(path) 如果path是一个存在的目录,则返回
True
。否则返回
False
os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
os模块官网地址:https://docs.python.org/2/library/os.html?highlight=os#module-os
os补充:
>>> os.listdir()
[‘.idea‘, ‘day07‘, ‘FTP‘, ‘oldboy‘, ‘练习‘]
>>> os.makedirs("dirname1/dirname2")
>>> os.listdir()
[‘.idea‘, ‘day07‘, ‘dirname1‘, ‘FTP‘, ‘oldboy‘, ‘练习‘]
>>> os.removedirs("dirname1/dirname2")
>>> os.listdir()
[‘.idea‘, ‘day07‘, ‘FTP‘, ‘oldboy‘, ‘练习‘]
>>> os.stat(‘D:\\python\\untitled‘)
os.stat_result(st_mode=16895, st_ino=844424930136207, st_dev=369559483, st_nlink=1, st_uid=0, st_gid=0, st_size=4096, st_atime=1513151026, st_mtime=1513151026, st_ctime=1500456486)
>>> os.sep #获取路径分隔符
‘\\‘
>>> os.path.split(‘D:\\python\\untitled\\__file__‘)
(‘D:\\python\\untitled‘, ‘__file__‘)
#######################################
os.path.join:
- import os
- help(os.path.join)
函数功能:连接两个或更多的路径名组件
如果各组件名首字母不包含‘/‘,则函数会自动加上
如果有一个组件是一个绝对路径,则在它之前的所有组件均会被舍弃
如果最后一个组件为空,则生成的路径以一个‘/‘分隔符结尾
- path=os.getcwd() #获得当前路径
- path_a=path+"/hello"
- path_b=path+"/wo"
- path_c="hehe"
- path_d=""
- os.path.join(path,path_a,path_b,path_c,path_d)
最后路径取了path_b的绝对路径
4、sys模块
sys.argv 命令行参数
List
,第一个元素是程序本身路径
sys.exit(n) 退出程序,正常退出时exit(
0
)
sys.version 获取Python解释程序的版本信息
sys.maxsize 最大
值2147483647
sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
>>>
sys.stdout.write("please:")
>>>
sys.stdin.readline()[:-1] >? hehe
‘hehe‘
>>> sys.stdin.readline()
>? heh
‘heh\n‘
5、hashlib模块
用于加密相关的操作,3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法
import
hashlib
m
=
hashlib.md5()
m.update(b
"Hello"
)
m.update(b
"It‘s me"
)
print
(m.digest())
m.update(b
"It‘s been a long time since last time we ..."
)
print
(m.digest())
#2进制格式hash
print
(
len
(m.hexdigest()))
#16进制格式hash
‘‘‘
def digest(self, *args, **kwargs): # real signature unknown
""" Return the digest value as a string of binary data. """
pass
def hexdigest(self, *args, **kwargs): # real signature unknown
""" Return the digest value as a string of hexadecimal digits. """
pass
‘‘‘
import
hashlib
hash
=
hashlib.md5() ---》 sha1 / sha256 / sha384 / sha512 用法都是一样
hash
.update(
‘admin‘
)
print
(
hash
.hexdigest())
还不够吊?python 还有一个 hmac 模块,它内部对我们创建 key 和 内容 再进行处理然后再加密
散列消息鉴别码,简称HMAC,是一种基于消息鉴别码MAC(Message Authentication Code)的鉴别机制。使用HMAC时,消息通讯的双方,通过验证消息中加入的鉴别密钥K来鉴别消息的真伪;
一般用于网络通信中消息加密,前提是双方先要约定好key,就像接头暗号一样,然后消息发送把用key把消息加密,接收方用key + 消息明文再加密,拿加密后的值 跟 发送者的相对比是否相等,这样就能验证消息的真实性,及发送者的合法性了。
>>> h = hmac.new(‘天王盖地虎‘.encode(‘utf-8‘), ‘宝塔镇河妖‘.encode(‘utf-8‘)) # 可以一个也可以多个
>>> h.hexdigest()
‘5f90dcd2211cd11601ce05195e3c5232‘
6、shutil
高级的 文件、文件夹、压缩包 处理模块
shutil.copyfileobj(fsrc, fdst[, length]) # 只拷贝文件内容,传入的参数是文件对象
shutil.copyfile(src, dst) # 拷贝文件内容,传输的参数是文件名
shutil.copymode(src, dst) # 只改变文件权限
-rw-rw---- 1 es es 54 Dec 14 13:46 mytest
-rw-rw---- 1 root root 0 Dec 14 19:28 mytest01
shutil.copystat(src, dst) # 拷贝文件状态 (权限mode bits, atime, mtime, flags),不包括用户与属组
[root@iZ9ohvmoegp9kuZ tmp]# stat mytest
File: ‘mytest’
Size: 54 Blocks: 8 IO Block: 4096 regular file
Device: ca01h/51713d Inode: 393228 Links: 1
Access: (0660/-rw-rw----) Uid: ( 1001/ es) Gid: ( 1001/ es)
Access: 2017-12-14 13:50:31.048796289 +0800
Modify: 2017-12-14 13:46:28.300799584 +0800
Change: 2017-12-14 13:50:25.382679700 +0800
[root@iZ9ohvmoegp9kuZ tmp]# stat mytest01
File: ‘mytest01’
Size: 0 Blocks: 0 IO Block: 4096 regular empty file
Device: ca01h/51713d Inode: 393227 Links: 1
Access: (0660/-rw-rw----) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2017-12-14 13:50:31.048796289 +0800
Modify: 2017-12-14 13:46:28.300799584 +0800
Change: 2017-12-14 19:34:30.919403706 +0800
shutil.copy(src, dst) # 拷贝文件内容与权限
shutil.copy2(src, dst) # 拷贝文件内容、权限、状态
shutil.copytree(src, dst, symlinks=False, ignore=None) # 递归拷贝
shutil.rmtree(path[, ignore_errors[, onerror]]) # 递归的去删除文件
shutil.move(src, dst) # 递归的移动文件或目录
shutil.make_archive(base_name, format,...) # 压缩文件
创建压缩包并返回文件路径,例如:zip、tar
- base_name: 压缩包的文件名,也可以是压缩包的路径。只是文件名时,则保存至当前目录,否则保存至指定路径,
如:www =>保存至当前路径
如:/Users/wupeiqi/www =>保存至/Users/wupeiqi/ - format: 压缩包种类,“zip”, “tar”, “bztar”,“gztar”
- root_dir: 要压缩的文件夹路径(默认当前目录)
- owner: 用户,默认当前用户
- group: 组,默认当前组
- logger: 用于记录日志,通常是logging.Logger对象
shutil 对压缩包的处理是调用 ZipFile 和 TarFile 两个模块来进行的,详细:
zipfile 压缩解压
import zipfile
# 压缩
z = zipfile.ZipFile(‘laxi.zip‘, ‘w‘)
z.write(‘a.log‘)
z.write(‘data.data‘)
z.close()
# 解压
z = zipfile.ZipFile(‘laxi.zip‘, ‘r‘)
z.extractall()
z.close()
tarfile 压缩解压
import tarfile
# 压缩
tar = tarfile.open(‘your.tar‘,‘w‘)
tar.add(‘/Users/wupeiqi/PycharmProjects/bbs2.zip‘, arcname=‘bbs2.zip‘)
tar.add(‘/Users/wupeiqi/PycharmProjects/cmdb.zip‘, arcname=‘cmdb.zip‘)
tar.close()
# 解压
tar = tarfile.open(‘your.tar‘,‘r‘)
tar.extractall() # 可设置解压地址
tar.close()
7、shelve模块
shelve模块是一个简单的k,v将内存数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据格式
import shelve
d = shelve.open("shelve_test") 打开一个文件
############# 写入文件内容 ###########
info = {"age": 22, "job": "it"}
name = ["ale", "rain", "test"]
d["name"] = name
d["info"] = info
d.close()
############# 读取文件内容 ##########
print(d.get("info"))
print(d.get(‘name‘))
8、xml模块
import xml.etree. ElementTree as ET
xml协议在各个语言里的都 是支持的,在python中可以用以下模块操作xml
出来如下:
修改xml文件( 每个year中添加 update = yes,修改 node.text 值 )
删除xml文件(country 整个node删除)
9、configparser模块
例如:my.ini配置文件
10、re模块
‘.‘
默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
‘^‘
匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r
"^a"
,
"\nabc\neee"
,flags
=
re.MULTILINE)
‘$‘
匹配字符结尾,或e.search(
"foo$"
,
"bfoo\nsdfsf"
,flags
=
re.MULTILINE).group()也可以
‘*‘
匹配
*
号前的字符
0
次或多次,re.findall(
"ab*"
,
"cabb3abcbbac"
) 结果为[
‘abb‘
,
‘ab‘
,
‘a‘
]
‘+‘
匹配前一个字符
1
次或多次,re.findall(
"ab+"
,
"ab+cd+abb+bba"
) 结果[
‘ab‘
,
‘abb‘
]
‘?‘
匹配前一个字符
1
次或
0
次
‘{m}‘
匹配前一个字符m次
‘{n,m}‘
匹配前一个字符n到m次,re.findall(
"ab{1,3}"
,
"abb abc abbcbbb"
) 结果
‘abb‘
,
‘ab‘
,
‘abb‘
]
‘|‘
匹配|左或|右的字符,re.search(
"abc|ABC"
,
"ABCBabcCD"
).group() 结果
‘ABC‘
‘(...)‘
分组匹配,re.search(
"(abc){2}a(123|456)c"
,
"abcabca456c"
).group() 结果 abcabca456c
‘\A‘
只从字符开头匹配,re.search(
"\Aabc"
,
"alexabc"
) 是匹配不到的
‘\Z‘
匹配字符结尾,同$
‘\d‘
匹配数字
0
-
9
‘\D‘
匹配非数字
‘\w‘
匹配[A
-
Za
-
z0
-
9
]
‘\W‘
匹配非[A
-
Za
-
z0
-
9
]
‘s‘
匹配空白字符、\t、\n、\r , re.search(
"\s+"
,
"ab\tc1\n3"
).group() 结果
‘\t‘
‘(?P<name>...)‘
分组匹配 re.search(
"(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})"
,
"371481199306143242"
).groupdict(
"city"
) 结果{
‘province‘
:
‘3714‘
,
‘city‘
:
‘81‘
,
‘birthday‘
:
‘1993‘
}
最常用的匹配语法
re.match 从头开始匹配
re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回
re.splitall 以匹配到的字符当做列表分隔符
re.sub 匹配字符并替换
反斜杠的困扰
与大多数编程语言相同,正则表达式里使用"\"作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\\"表示。同样,匹配一个数字的"\\d"可以写成r"\d"。有了原生字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
仅需轻轻知道的几个匹配模式
re.I(re.IGNORECASE): 忽略大小写(括号内是完整写法,下同)
M(MULTILINE): 多行模式,改变
‘^‘
和
‘$‘
的行为(参见上图)
S(DOTALL): 点任意匹配模式,改变
‘.‘
的行为
11、 logging日志模块
Python 使用logging模块记录日志涉及四个主要类,使用官方文档中的概括最为合适:
logger提供了应用程序可以直接使用的接口;
handler将(logger创建的)日志记录发送到合适的目的输出;
filter提供了细度设备来决定输出哪条日志记录;
formatter决定日志记录的最终输出格式。