标签:维护 工具 posix rmdir sds sed win exist make
一、模块
1. 什么是模块
在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。
为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。
2. 使用模块的好处
最大的好处是大大提高了代码的可维护性。其次,编写代码不必从零开始。当一个模块编写完毕,就可以被其他地方引用。我们在编写程序的时候,也经常引用其他模块,包括Python内置的模块和来自第三方的模块。
使用模块还可以避免函数名和变量名冲突。相同名字的函数和变量完全可以分别存在不同的模块中,因此,我们自己在编写模块时,不必考虑名字会与其他模块冲突。但是也要注意,尽量不要与内置函数名字冲突。点这里查看Python的所有内置函数。
3. 使用模块
Python本身就内置了很多非常有用的模块,只要安装完毕,这些模块就可以立刻使用。
我们以内建的sys
模块为例,编写一个hello
的模块:
1 # !/usr/bin/env python3 #该行注释可以使本文件直接在Unix/Linux/Mac上运行 2 # -*- coding: utf-8 -*- #该行注释表示文件本身使用标准UTF-8编码 3 4 ‘ a test module ‘ #表示模块的文档注释,任何模块代码的第一个字符串都被视为模块的文档注释 5 6 __author__ = ‘Michael Liao‘ #使用__author__变量将作者写入文件 7 8 import sys #导入内置模块sys(使用模块的方式) 9 10 11 def test(): 12 args = sys.argv #调用sys模块的argv属性,该变量以列表的形式存储命令行的所有参数 13 if len(args) == 1: 14 print(‘Hello, world!‘) 15 elif len(args) == 2: 16 print(‘Hello, %s!‘ % args[1]) 17 else: 18 print(‘Too many arguments!‘) 19 20 21 if __name__ == ‘__main__‘: #当我们在命令行运行hello模块文件时,Python解释器把一个特殊变量__name__置为__main__,而如果在其他地方导入该hello模块时,if判断将失败, 22 # 因此,这种if测试可以让一个模块通过命令行运行时执行一些额外的代码,最常见的就是运行测试。 23 test()
4. 安装第三方模块
在Python中,安装第三方模块,是通过包管理工具pip完成的。
#在命令行模式下运行:Pillow为第三方的模块名称 pip install Pillow
5. 模块搜索路径
当我们试图加载一个模块时,Python会在指定的路径下搜索对应的.py文件,如果找不到,就会报错,如上图所示,import hello报错
默认情况下,Python解释器会搜索当前目录、所有已安装的内置模块和第三方模块,搜索路径存放在sys
模块的path
变量中:
>>> import sys >>> sys.path [‘‘, ‘C:\\Python36\\python36.zip‘, ‘C:\\Python36\\DLLs‘, ‘C:\\Python36\\lib‘, ‘C:\\Python36‘, ‘C:\\Python36\\lib\\site-packages ‘] >>>
如果我们要添加自己的搜索目录,有两种方法:
一是直接修改sys.path
,添加要搜索的目录:
>>> import sys >>> sys.path.append(‘要搜索的目录‘)
这种方法是在运行时修改,运行结束后失效。
第二种方法是设置环境变量PYTHONPATH
,该环境变量的内容会被自动添加到模块搜索路径中。设置方式与设置Path环境变量类似。注意只需要添加你自己的搜索路径,Python自己本身的搜索路径不受影响。
二、常用模块
1. time
a. 在Python中,通常有这三种方式来表示时间:时间戳、元组(struct_time)、格式化的时间字符串:
import time #时间戳(timestamp) 通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。 time.time() 1493207044.6561139 #格式化的时间字符串(Format String): time.strftime(‘%Y-%m-%d %X‘) ‘2017-04-26 19:47:54‘ #元组(struct_time) :struct_time元组共有9个元素:(年,月,日,时,分,秒,本周的第几天(周一为0),本年的第几天,时区) time.localtime() time.struct_time(tm_year=2017, tm_mon=4, tm_mday=26, tm_hour=19, tm_min=48, tm_sec=23, tm_wday=2, tm_yday=116, tm_isdst=0)
小结:时间戳是计算机能够识别的时间;时间字符串是人能够看懂的时间;元组则是用来操作时间的
b. 时间形式的转换
#时间戳--->结构化时间 time.localtime() time.struct_time(tm_year=2017, tm_mon=4, tm_mday=26, tm_hour=19, tm_min=57, tm_sec=38, tm_wday=2, tm_yday=116, tm_isdst=0) time.gmtime() time.struct_time(tm_year=2017, tm_mon=4, tm_mday=26, tm_hour=11, tm_min=57, tm_sec=48, tm_wday=2, tm_yday=116, tm_isdst=0) #结构化时间--->时间戳 time.mktime(time.localtime()) 1493208155.0 time.mktime(time.gmtime()) 1493179366.0 #结构化时间--->字符串时间 time.strftime(‘%Y-%m-%d %X‘, time.localtime()) ‘2017-04-26 20:04:22‘ #字符串时间--->结构化时间 time.strptime(‘2017-04-27‘, ‘%Y-%m-%d‘) time.struct_time(tm_year=2017, tm_mon=4, tm_mday=27, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=117, tm_isdst=-1)
c. asctime and ctime
#结构化的时间--->字符串时间 time.asctime(time.localtime(1493208155.0)) ‘Wed Apr 26 20:02:35 2017‘ #时间戳--->字符串时间 time.ctime(1493208155.0) ‘Wed Apr 26 20:02:35 2017‘
2. random
import random #随机小数x: 0<x<1 random.random() 0.9354224633786534 #随机整数x: 1<=x<=10 random.randint(1,10) 1 #随机整数x: 3=<x<5 random.randrange(3,5) 3 #随机返回列表中的任一元素 random.choice([1,‘23‘,[4,5]]) 1 #随机返回列表中的任一元素 random.choice([1,‘23‘,[4,5]]) [4, 5] #随机返回列表中的任2元素 random.sample([2,‘a‘,33,[‘b‘,56],7],2) [‘a‘, 7] #随机小数x: 1<x<3 random.uniform(1,3) 1.8055721248003096 #将列表中的元素打乱 item = [1,3,5,7,9] #打乱前 random.shuffle(item) item [9, 3, 5, 1, 7] #打乱后
练习:
1 import random 2 3 def v_code(): 4 5 “”“根据ASCII码定制5位随机字符验证码”“” 6 code = ‘‘ 7 for i in range(5): 8 a = random.randint(48, 57) # 数字0-9 9 b = random.randint(65, 90) # 大写字母A-Z 10 c = random.randint(97, 122) # 小写字母a-z 11 d = random.choice([a, b, c]) #随机返回以上3个范围的数字 12 code = ‘‘.join([code, chr(d)]) 13 14 return code 15 16 17 print(v_code())
3. hashlib
a. 算法介绍
Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。
什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。
摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。
我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值:
1 import hashlib 2 3 md5 = hashlib.md5() 4 md5.update(‘Hello world!‘.encode(‘utf-8‘)) 5 print(md5.hexdigest()) 6 7 #结果: 8 #86fb269d190d2c85f6e0468ceca42a20
如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:
1 import hashlib 2 3 md5 = hashlib.md5() 4 md5.update(‘Hello ‘.encode(‘utf-8‘)) #注意:Hello后面有一个空格 5 md5.update(‘world!‘.encode(‘utf-8‘)) 6 print(md5.hexdigest()) 7 8 #结果: 9 #86fb269d190d2c85f6e0468ceca42a20
MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:
1 import hashlib 2 3 sha1 = hashlib.sha1() 4 sha1.update(‘Hello ‘.encode(‘utf-8‘)) # 5 sha1.update(‘world!‘.encode(‘utf-8‘)) 6 print(sha1.hexdigest()) 7 8 sha2 = hashlib.sha1() 9 sha2.update(‘Hello world!‘.encode(‘utf-8‘)) 10 print(sha2.hexdigest()) 11 12 #结果: 13 #d3486ae9136e7856bc42212385ea797094475802 14 #d3486ae9136e7856bc42212385ea797094475802
SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。
b. 算法应用
任何允许用户登录的网站都会存储用户登录的用户名和口令。如何存储用户名和口令呢?方法是存到数据库表中:
name | password --------+---------- michael | 123456 bob | abc999 alice | alice2008
如果以明文保存用户口令,如果数据库泄露,所有用户的口令就落入黑客的手里。此外,网站运维人员是可以访问数据库的,也就是能获取到所有用户的口令。正确的保存口令的方式是不存储用户的明文口令,而是存储用户口令的摘要,比如MD5:
username | password ---------+--------------------------------- michael | e10adc3949ba59abbe56e057f20f883e bob | 878ef96e86145580c38c87f0410ad153 alice | 99b1c2188db85afee403b1536010c2c9
考虑这么个情况,很多用户喜欢用123456,888888,password这些简单的口令,于是,黑客可以事先计算出这些常用口令的MD5值,得到一个反推表:
‘e10adc3949ba59abbe56e057f20f883e‘: ‘123456‘ ‘21218cca77804d2ba1922c33e0151105‘: ‘888888‘ ‘5f4dcc3b5aa765d61d8327deb882cf99‘: ‘password‘
这样,无需破解,只需要对比数据库的MD5,黑客就获得了使用常用口令的用户账号。
对于用户来讲,当然不要使用过于简单的口令。但是,我们能否在程序设计上对简单口令加强保护呢?
由于常用口令的MD5值很容易被计算出来,所以,要确保存储的用户口令不是那些已经被计算出来的常用口令的MD5,这一方法通过对原始口令加一个复杂字符串来实现,俗称“加盐”:
hashlib.md5("salt".encode("utf8"))
经过Salt处理的MD5口令,只要Salt不被黑客知道,即使用户输入简单口令,也很难通过MD5反推明文口令。
但是如果有两个用户都使用了相同的简单口令比如123456,在数据库中,将存储两条相同的MD5值,这说明这两个用户的口令是一样的。有没有办法让使用相同口令的用户存储不同的MD5呢?
如果假定用户无法修改登录名,就可以通过把登录名作为Salt的一部分来计算MD5,从而实现相同口令的用户也存储不同的MD5。
摘要算法在很多地方都有广泛的应用。要注意摘要算法不是加密算法,不能用于加密(因为无法通过摘要反推明文),只能用于防篡改,但是它的单向计算特性决定了可以在不存储明文口令的情况下验证用户口令。
4. os
1 ‘‘‘ 2 os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 3 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd 4 os.curdir 返回当前目录: (‘.‘) 5 os.pardir 获取当前目录的父目录字符串名:(‘..‘) 6 os.makedirs(‘dirname1/dirname2‘) 可生成多层递归目录 7 os.removedirs(‘dirname1‘) 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 8 os.mkdir(‘dirname‘) 生成单级目录;相当于shell中mkdir dirname 9 os.rmdir(‘dirname‘) 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname 10 os.listdir(‘dirname‘) 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 11 os.remove() 删除一个文件 12 os.rename("oldname","newname") 重命名文件/目录 13 os.stat(‘path/filename‘) 获取文件/目录信息 14 os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/" 15 os.linesep 输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n" 16 os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为: 17 os.name 输出字符串指示当前使用平台。win->‘nt‘; Linux->‘posix‘ 18 os.system("bash command") 运行shell命令,直接显示 19 os.environ 获取系统环境变量 20 os.path.abspath(path) 返回path规范化的绝对路径 21 os.path.split(path) 将path分割成目录和文件名二元组返回 22 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 23 os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素 24 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False 25 os.path.isabs(path) 如果path是绝对路径,返回True 26 os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False 27 os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False 28 os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 29 os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间 30 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 31 os.path.getsize(path) 返回path的大小 32 ‘‘‘
5. sys
sys.argv 命令行参数List,第一个元素是程序本身路径
sys.exit(n) 退出程序,正常退出时exit(0)
sys.version 获取Python解释程序的版本信息
sys.maxint 最大的Int值
sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
参考资料:
1. http://www.cnblogs.com/yuanchenqi/articles/6766020.html
标签:维护 工具 posix rmdir sds sed win exist make
原文地址:http://www.cnblogs.com/OldJack/p/6770600.html