Python 学习之路(三)
以下所用的是Python 3.6
一、集合部分
集合是一个无序的,不重复的数据集合,主要用来去重,以及关系测试:交集,差集,并集等
1.1 关系操作
1.1.1 列表去重
可以给列表去重,例如:
1 set_demo = [1,2,3,4,5,3,2,1] # 列表 2 set_demo = set(set_demo) # 转换成集合,来去重 3 print(set_demo)
1.1.2 取交集 intersection()方法
可以获得两个集合的交集部分,例如:
1 set_demo_1 = set([2,3,4,5,4]) 2 set_demo_2 = set([2,22,33,44,11]) 3 print(set_demo_1.intersection(set_demo_2))
1.1.3 取并集 union()方法
可以获得两个集合的并集,例如:
1 set_demo_1 = set([2,3,4,5,4]) 2 set_demo_2 = set([2,22,33,44,11]) 3 print(set_demo_1.union(set_demo_2))
1.1.4 差集 difference()方法
去除调用对象中的与参数共有的部分,即差集,例如:
1 set_demo_1 = set([1,2,3,4,5]) 2 set_demo_2 = set([1,2,3]) 3 print(set_demo_1.issuperset(set_demo_2))#set_demo_1是set_demo_2的父集 返回true 4 print(set_demo_2.issubset(set_demo_1))#set_demo_2是set_demo_1的子集 返回true
1.1.5 子集、父集
可以使用issubset,issuperset方法,例如:
1 set_demo_1 = set([1,2,3,4,5]) 2 set_demo_2 = set([1,2,3]) 3 print(set_demo_1.issuperset(set_demo_2))#set_demo_1是set_demo_2的父集 返回true 4 print(set_demo_2.issubset(set_demo_1))#set_demo_2是set_demo_1的子集 返回true
1.1.6 对称差集
集合A与集合B中所有不属于A∩B的元素的集合,例如:
1 set_demo_1 = set([2,3,4,5,4]) 2 set_demo_2 = set([2,22,33,44,11]) 3 print(set_demo_1.symmetric_difference(set_demo_2)) #返回去掉两者交集的部分
1.1.7 不相交的
两个集合如果没有交集就返回true,例如:
1 set_demo_1 = set([1,2,3,4,5]) 2 set_demo_2 = set([11,22,33]) 3 print(set_demo_1.isdisjoint(set_demo_2))#没有交集返回true
1.1.8 使用运算符来代替方法调用
1 A = B | C #取并集 2 A = B & C #取交集 3 A = B - C #取差集,在B中去掉C中的部分 4 A = B ^ C #取对称差集
1.2 基本操作
1 set_demo = set([1,2,3,4,5]) 2 set_demo.add(66) #添加操作,添加一项 3 set_demo.update([11,22]) #添加操作,添加多项 4 5 set_demo.remove(66) #删除操作,删除指定一项,若没有则报错 6 len(set_demo) # 集合长度 7 8 set_demo.pop() #删除操作,随机删除一个,并且返回该值 9 set_demo.discard(666) #删除操作,删除指定一个,若没有则什么都不做 10 print(set_demo)
二、文件部分
基本的流程:打开文件->操作文件->关闭文件
2.1 文件打开模式
模式 | 含义 |
---|---|
r | 打开只读文件,该文件必须存在。 |
r+ | 打开可读写的文件,该文件必须存在。 |
w | 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。 |
w+ | 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。 |
a | 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。 |
a+ | 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。 |
注:上述的形态字符串都可以再加一个b字符,如rb、w+b或ab+等组合,加入b 字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。不过在POSIX系统,包含Linux都会忽略该字符。
2.2 文件的读写操作
读文件操作,read(size)方法,参数可以输入读取长度,不填默认读取全部
1 f = open("file_demo",mode="r",encoding=‘utf-8‘) #创建文件句柄引用 2 print(f.read()) 3 f.close()
写文件操作
1 f = open("file_demo",mode="w",encoding=‘utf-8‘) #创建文件句柄引用 2 f.write("测试用例\n") 3 f.close()
读一行、多行
1 f = open("file_demo",mode="r",encoding=‘utf-8‘) #创建文件句柄引用 2 print(f.readline()) #单行读取 3 f.close() 4 5 f = open("file_demo",mode="r",encoding=‘utf-8‘) #创建文件句柄引用 6 for line in f.readlines(): #读取全部文件的全部行,存放着文件中,如果文件较大则速度会非常慢,一般不推荐readlines 7 print(line.strip()) 8 f.close()
2.3 文件的光标(位置操作)
文件位置操作有以下几个方法:tell,seek tell()可以返回当前位置 seek(offset[, whence]),offset参数是开始的偏移量,表示偏移几个字节,whence默认为0,表示要从哪个位置开始偏移:0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。
2.4 文件的flush()操作
flush()方法刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件,而不是被动的等待输出缓冲区写入。可以防止断电等情况使数据没有写入文件。
1 f = open("file_demo",mode="a",encoding=‘utf-8‘) #创建文件句柄引用 2 f.write("这是追加数据") 3 f.flush()#将缓存区的数据写入到文件 4 f.close()
2.5 文件的truncate()方法
truncate( [ size ]):用于从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后,后面的所有字符被删除。
2.6 其他操作
fileno()返回一个整形的文件描述符 encoding()返回打开文件的编码方式 isatty()如果文件连接到一个终端设备返回 True,否则返回 False readable()如果文件可读,则返回True,否则返回 False writeable()如果文件可写,则返回True,否则返回 False
2.7 with操作
with可以自动帮忙关闭文件,释放资源
1 with open("file_demo",mode="r",encoding="utf-8" ) as f: 2 for line in f: 3 print(line.strip()) #strip用来去除换行
三、JSON 序列化与反序列化
序列化可以简单的理解为将对象存储到文件中,反序列化可以简单理解为将文件数据读取用对象来存储 序列化过程
1 import json #导入json包 2 3 # 序列化过程 4 # 字典类型转换为 JSON 对象 5 info = { "name":"CodeHu", 6 "age": 25} 7 with open("json.text","w") as f: 8 f.write( json.dumps(info) ) 9 #json.dump(info,f) #或者使用dump
反序列过程
1 import json 2 # 反序列化 3 with open("json.text","r") as f: 4 print(json.loads(f.read())["age"]) 5 #print(json.load(f)["age"])#可以采用load方法读取
四、工程目录规范
4.1 一般目录结构
假设你的项目名为foo, 最方便快捷目录结构:
Foo/
|-- bin/
| |-- foo
|
|-- foo/
| |-- tests/
| | |-- __init__.py
| | |-- test_main.py
| |
| |-- __init__.py
| |-- main.py
|
|-- docs/
| |-- conf.py
| |-- abc.rst
|
|-- setup.py
|-- requirements.txt
|-- README
简要解释一下:
- bin/: 存放项目的一些可执行文件,当然你可以起名script/之类的也行。
- foo/: 存放项目的所有源代码。(1) 源代码中的所有模块、包都应该放在此目录。不要置于顶层目录。(2) 其子目录tests/存放单元测试代码; (3)程序的入口最好命名为 main.py。
- docs/: 存放一些文档。
- setup.py: 安装、部署、打包的脚本。
- requirements.txt: 存放软件依赖的外部Python包列表。
- README: 项目说明文件。
4.2 README文件
这个是每个项目都应该有的一个文件,目的是能简要描述该项目的信息,让读者快速了解这个项目。
它需要说明以下几个事项:
- 软件定位,软件的基本功能。
- 运行代码的方法: 安装环境、启动命令等。
- 简要的使用说明。
- 代码目录结构说明,更详细点可以说明软件的基本原理。
- 常见问题说明。
4.3 setup.py
一般来说,用setup.py来管理代码的打包、安装、部署问题。业界标准的写法是用Python流行的打包工具setuptools来管理这些事情。这种方式普遍应用于开源项目中。不过这里的核心思想不是用标准化的工具来解决这些问题,而是说,一个项目一定要有一个安装部署工具,能快速便捷的在一台新机器上将环境装好、代码部署好和将程序运行起来。
4.4 requirements.txt
这个文件存在的目的是: 方便开发者维护软件的包依赖。将开发过程中新增的包添加进这个列表中,避免在setup.py安装依赖时漏掉软件包。 方便读者明确项目使用了哪些Python包。 这个文件的格式是每一行包含一个包依赖的说明,通常是flask>=0.10这种格式,要求是这个格式能被pip识别,这样就可以简单的通过 pip install -r requirements.txt来把所有Python包依赖都装好。