相识python 之小数据池集合

时间：2019-08-09 01:20:32 阅读：80 评论：0 收藏：0 [点我收藏+]

?一. ?小数据池
在说?小数据池之前. 我们先看?一个概念念. 什什么是代码块:

根据提示我们从官?方?文档找到了了这样的说法:

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.
A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed.

粗略略的翻译:
python程序是由代码块构成的. ?一个代码块的?文本作为python程序执?行行的单元.
代码块: ?一个模块, ?一个函数, ?一个类, 甚?至每?一个command命令都是?一个代码块. ?一个?文件也是?一个代码块, eval()和exec()执?行行的时候也是?一个代码块

什什么是命令?行行?
我们在控制台CMD中输入python进入的就是python的command模式. 在这?里里也可以写 python的程序.
?而根据上?面的官?方的解释来看. ?一个command命令就是?一个python代码块

?二. 接下来我们来看?一下?小数据池 is和==的区别 1. id()

通过id()我们可以查看到?一个变量量表?示的值在内存中的地址.

\2. is和==

== 判断左右两端的值是否相等. 是不是?一致.

is 判断左右两端内容的内存地址是否?一致. 如果返回True, 那可以确定这两个变量量使 ?用的是同?一个对象

s = ‘alex‘
print(id(s)) # 4326667072

我们可以这样认为. 如果内存地址相同. 那么值?一定是相等的. 如果值相等. 则不?一定是同?一个对象

?小数据池. ?一种数据缓存机制. 也被称为驻留留机制. 各?大编程语?言中都有类似的东?西. 在?网上搜索常量量池,?小数据池指的都是同?一个内容.
?小数据池只针对: . 其他的数据类型不存在驻留留机制

整数, 字符串串, 布尔值

对于整数，Python官?方?文档中这么说:
The current implementation keeps an array of integer objects for all integers between -5 and 256, when you create an int in that range you actually just get back a reference to the existing object. So it should be possible to change the value of 1. I suspect the behaviour of Python in this case is undefined.

对于字符串串:

Incomputer science, string interning is a method of storing only onecopy of each distinct string value, which must be immutable. Interning strings makes some stringprocessing tasks more time- or space-efficient at the cost of requiring moretime when the string is created or interned. The distinct

values are stored ina string intern pool. –引?自维基百科

在python中对-5到256之间的整数会被驻留留在内存中. 将?一定规则的字符串串缓存. 在使?用的时候, 内存中只会创建?一个该数据的对象. 保存在?小数据池中. 当使?用的时候直接从?小数据池中获取对象的内存引?用. ?而不需要创建?一个新的数据. 这样会节省更更多的内存区域.

优点: 能够提?高?一些字符串串, 整数的处理理速度. 省略略的创建对象的过程. 缺点: 在‘池‘中创建或者插入新的内容会花费更更多的时间.

对于数字: -5~256是会被加到?小数据池中的. 每次使?用都是同?一个对象. 对于字符串串:

如果字符串串的?长度是0或者1,都会默认进?行行缓存
字符串串?长度?大于1,但是字符串串中只包含字?母,数字,下划线时才会缓存
?用乘法的到的字符串串.1.乘数为1,仅包含数字,字?母,下划线时会被缓存.如果

包含其他字符, ?而?长度<=1 也会被驻存, 2. 乘数?大于1 . 仅包含数字, 字?母, 下划

线这个时候会被缓存. 但字符串串?长度不能?大于20
指定驻留留.我们可以通过sys模块中的intern()函数来指定要驻留留的内容.

OK. 到?目前为?止. 我们已经了了解了了python的?小数据池的?一些基本情况了了. 但是!!!! 还有最后?一个问题. ?小数据池和最开始的代码块有什什么关系呢? 同样的?一段代码在命令?行行窗?口和在py?文件中. 出现的效果是完全不?一样的.

在代码块内的缓存机制是不?一样的. 在执?行行同?一个代码块的初始化对象的命令时, 会检查是否其值是否已经存在, 如果存在, 会将其重?用. 换句句话说: 执?行行同?一个代码块时, 遇到初始化对象的命令时，他会将初始化的这个变量量与值存储在?一个字典中, 在遇到新的变量量时, 会先在字典中查询记录, 如果有同样的记录那么它会重复使?用这个字典中的之前的这个值. 所以在你给出的例例?子中, ?文件执?行行时(同?一个代码块) 会把a, b两个变量量指向同?一个对象.

如果是不同的代码块, 他就会看这个两个变量量是否是满?足?小数据池的数据, 如果是满?足 ?小数据池的数据则会指向同?一个地址. 所以: a, b的赋值语句句分别被当作两个代码块执?行行, 但是他们不满?足?小数据池的数据所以会得到两个不同的对象, 因?而is判断返回False.

\1. 基础数据类型补充 2. set集合
\3. 深浅拷?贝

主要内容:
?一. 基础数据类型补充

?首先关于int和str在之前的学习中已经讲了了80%以上了了. 所以剩下的?自?己看?一看就可以了了. 我们补充给?一个字符串串基本操作

列列表: 循环删除列列表中的每?一个元素

li = ["李李嘉诚", "麻花藤", "?黄海海峰", "刘嘉玲"] s = "_".join(li)
print(s)

li = "?黄花?大闺?女女" s = "_".join(li) print(s)

li = [11, 22, 33, 44]
for e in li:
li.remove(e)
print(li)

结果: [22, 44]

分析原因:
for的运?行行过程. 会有?一个指针来记录当前循环的元素是哪?一个, ?一开始这个指针指向第0

个. 然后获取到第0个元素. 紧接着删除第0个. 这个时候. 原来是第?一个的元素会?自动的变成第0个. 然后指针向后移动?一次, 指向1元素. 这时原来的1已经变成了了0, 也就不会被删除了了.

?用pop删除试试看:

li = [11, 22, 33, 44]
for i in range(0, len(li)):
del li[i]
print(li)

结果: 报错
# i= 0, 1, 2 删除的时候li[0] 被删除之后. 后?面?一个就变成了了第0个.
# 以此类推. 当i = 2的时候. list中只有?一个元素. 但是这个时候删除的是第2个肯定报错啊

经过分析发现. 循环删除都不?行行. 不论是?用del还是?用remove. 都不能实现. 那么pop呢?

只有这样才是可以的:

或者. ?用另?一个列列表来记录你要删除的内容. 然后循环删除

for el in li:
li.pop() # pop也不不?行行

print(li) 结果: [11, 22]

for i in range(0, len(li)): # 循环len(li)次, 然后从后往前删除 li.pop()

print(li)

li = [11, 22, 33, 44]
del_li = []
for e in li:
del_li.append(e)
for e in del_li:
li.remove(e)

print(li)

注意: dict中的fromkey(),可以帮我们通过list来创建?一个dict

前?面列列表中的每?一项都会作为key, 后?面列列表中的内容作为value. ?生成dict 好了了. 注意:

由于删除元素会导致元素的索引改变, 所以容易易出现问题. 尽量量不要再循环中直接去删

除元素. 可以把要删除的元素添加到另?一个集合中然后再批量量删除.

dic = dict.fromkeys(["jay", "JJ"], ["周杰伦", "麻花藤"]) print(dic)

结果:
{‘jay‘: [‘周杰伦‘, ‘麻花藤‘], ‘JJ‘: [‘周杰伦‘, ‘麻花藤‘]}

dic = dict.fromkeys(["jay", "JJ"], ["周杰伦", "麻花藤"]) print(dic)

dic.get("jay").append("胡?大") print(dic)

结果:
{‘jay‘: [‘周杰伦‘, ‘麻花藤‘, ‘胡?大‘], ‘JJ‘: [‘周杰伦‘, ‘麻花藤‘, ‘胡?大‘]}

代码中只是更更改了了jay那个列列表. 但是由于jay和JJ?用的是同?一个列列表. 所以. 前?面那个改了了. 后

?面那个也会跟着改

dict中的元素在迭代过程中是不允许进?行行删除的

dic = {‘k1‘: ‘alex‘, ‘k2‘: ‘wusir‘, ‘s1‘: ‘?金金?老老板‘} # 删除key中带有‘k‘的元素
for k in dic:

? if ‘k‘ in k:
? del dic[k]
代的时候不不允许进?行行删除操作

print(dic)

# dictionary changed size during iteration, 在循环迭

那怎么办呢? 把要删除的元素暂时先保存在?一个list中, 然后循环list, 再删除

dic = {‘k1‘: ‘alex‘, ‘k2‘: ‘wusir‘, ‘s1‘: ‘?金金?老老板‘} dic_del_list = []
# 删除key中带有‘k‘的元素
for k in dic:

? if ‘k‘ in k:
? dic_del_list.append(k)
for el in dic_del_list:
? del dic[el]

print(dic)

类型转换:
元组 => 列列表 list(tuple) 列列表 => 元组 tuple(list)

list=>str str.join(list) str=>list str.split()

转换成False的数据: 0,‘‘,None,[],(),{},set() ==> False

set集合

set集合是pnthon 的一个基本数据类型.一般不是很常用.set中的元素是不重复的.无序的.里面的的元素必须是可hash 的(in str tuple bool),我们可以这样来记.set就是dict类型的数据但是不保存value,只保存key,set也用{}表示

注意:set中的元素必须是可hash 的,但是set本身是不可hash 的,set是可变的—元素是不可变得

set2 = {‘1‘,‘alex‘,2,True,[1,2,3]} -------报错-------里面有[]

set2 = {‘1‘,‘alex‘,2,True,{1:2}}---------------报错-------里面有{}}

set3 = {‘1‘,‘alex‘,2,True,(1,2,[2,3,4])} -------里面有()[]

set中的元素是不重复的且无序的

s = {"周杰伦", "周杰伦", "周星星"} print(s)

结果:
{‘周星星‘, ‘周杰伦‘} ——————— 不重复无序

使用这个特性.我们可以使用set来去掉重复

lst = [45,5,"华华",45,"华华",50]

lst = list(set(lst))———————把list切换成set 然后再换回List

print(lst)

set 集合增删改查

1.增加

s = {"刘嘉玲","关之琳","程丽","后小青","张彩云","江阳"}

s.add("熊华")

print(s)

s = add.("熊华") ——————— 重复的内容不会添加到set集合中

print(s)

s = {"刘嘉玲","关之琳","程丽","后小青","张彩云","江阳"}

s.update("龙池")--------------迭代添加

print(s)——————结果是{"刘嘉玲","关之琳","程丽","后小青","张彩云","江阳"龙","池"}

s.update(["张曼玉","张雅芝","张雅芝"] )

print(s)———————— 结果是{"刘嘉玲","关之琳","程丽","后小青","张彩云","江阳""张"曼""玉""雅""芝""}

2.删除

s={"刘嘉玲","关之琳","程丽","后小青","张彩云","江阳","龙池"}

item = s.pop()-------------随机弹出一个

print(s)

print(item)

s.remove("后小青")----------直接删除元素

s.remove("苍井空")——————本人不爱这个女人不存在这个女人删除就会报错

print(s)

s.clear()——————— 清空set集合.需要注意的是set集合如果是空的.打印出来的是set() 因为要和dict区分.

print()-----------set()

修改

set集合中的数据没有索引.也没有办法定位一个元素.所以没有办法直接修改.

我们可以采用先删除后添加方式来完成修改操作

s={"刘嘉玲","关之琳","程丽","后小青","张彩云","江阳","龙池"}—————把龙池换成提莫

s.remove("龙池")

s.add("提莫")

print(s)

查询

set是一个可迭代对象,所以可以进行for循环

for el in s :

? Print (el)

常用操作

S1 = {"刘能", "赵四", "?皮?长?山"}

s2 = {"刘科?长", "冯乡?长", "?皮?长?山"}

交集

两个集合中共有的元素

Print (s1 & s2)———————— {"皮长山"}

并集

print(s1 | s2) # {‘刘科?长‘, ‘冯乡?长‘, ‘赵四‘, ‘?皮?长?山‘, ‘刘能‘}

差集

print(s1 - s2) # {‘赵四‘, ‘刘能‘} 得到第?一个中单独存在的

反交集

print(s1 ^ s2) # 两个集合中单独存在的数据 {‘冯乡?长‘, ‘刘能‘, ‘刘科?长‘, ‘赵四‘}

s1 = {"刘能", "赵四"}
s2 = {"刘能", "赵四", "?皮?长?山"}

子集

print(s1 < s2) # set1是set2的?子集吗? True

超集

print(s1 > s2) # set1是set2的超集吗? False

深浅拷贝

lst 1= ["?金金?毛狮王", "紫衫?龙王", "?白眉鹰王", "?青翼蝠王"]

lst 2 = lst 1

print(lst1) ———————————————

print(lst2)________________———————— 两个结果完全相同

lst1.append("杨逍")

print(lst1)

print(lst2) 两个结果相同[‘?金金?毛狮王‘, ‘紫衫?龙王‘, ‘?白眉鹰王‘, ‘?青翼蝠王‘, ‘杨逍‘]

dic1 = {"id": 123, "name": "谢逊"}

dic2 = dic1

print(dic1)
print(dic2)

dic1[‘name‘] = "范瑶"

print(dic1) print(dic2)

对于list, set, dict来说, 直接赋值. 其实是把内存地址交给变量量. 并不是复制?一份内容. 所以.
lst1的内存指向和lst2是?一样的. lst1改变了, lst2也发?生了改变

浅拷?

lst1 = [金毛狮王", "紫衫龙王", "?眉鹰王", "?翼蝠王"]

lst2 = lst1
print(lst1)
print(lst2)

lst1.append("杨逍")

print(lst1)

print(lst2)

结果:
[‘金?毛狮王‘, ‘紫衫龙王‘, ‘?眉鹰王‘, ‘?翼蝠王‘, ‘杨逍‘] [‘?毛狮王‘, ‘紫衫龙王‘, ‘?眉鹰王‘, ‘?翼蝠王‘, ‘杨逍‘]

dic1 = {"id": 123, "name": "谢逊"} dic2 = dic1
print(dic1)
print(dic2)

dic1[‘name‘] = "范瑶"

print(dic1)

print(dic2)

结果: {‘id‘: 123, {‘id‘: 123, {‘id‘: 123, {‘id‘: 123,

‘name‘: ‘谢逊‘} ‘name‘: ‘谢逊‘} ‘name‘: ‘范瑶‘} ‘name‘: ‘范瑶‘}

对于list, set, dict来说, 直接赋值. 其实是把内存地址交给变量量. 并不是复制?一份内容. 所以. lst1的内存指向和lst2是?一样的. lst1改变了了, lst2也发?生了了改变

浅拷?

lst1 = ["何炅", "杜海海涛","周渝?民"]

lst2 = lst1.copy() lst1.append("李嘉诚")

print(lst1)

print(lst2)
print(id(lst1), id(lst2))

结果:
两个lst完全不不?一样. 内存地址和内容也不不?一样. 发现实现了了内存的拷?贝

lst1 = ["何炅", "杜海海涛","周渝?民", ["麻花藤", "?马芸", "周笔畅"]] lst2 = lst1.copy()
lst1[3].append("?无敌是多磨寂寞")
print(lst1)

print(lst2)
print(id(lst1[3]), id(lst2[3]))

结果:
[‘何炅‘, ‘杜海海涛‘, ‘周渝?民‘, [‘麻花藤‘, ‘?马芸‘, ‘周笔畅‘, ‘?无敌是多磨寂寞‘]] [‘何炅‘, ‘杜海海涛‘, ‘周渝?民‘, [‘麻花藤‘, ‘?马芸‘, ‘周笔畅‘, ‘?无敌是多磨寂寞‘]] 4417248328 4417248328

浅拷?贝. 只会拷?贝第?一层. 第?二层的内容不会拷?贝. 所以被称为浅拷?贝

深拷?贝

import copy

lst1 = ["何炅", "杜海海涛","周渝?民", ["麻花藤", "?马芸", "周笔畅"]] lst2 = copy.deepcopy(lst1)
lst1[3].append("?无敌是多磨寂寞")
print(lst1)

print(lst2)
print(id(lst1[3]), id(lst2[3]))

结果:
[‘何炅‘, ‘杜海海涛‘, ‘周渝?民‘, [‘麻花藤‘, ‘?马芸‘, ‘周笔畅‘, ‘?无敌是多磨寂寞‘]] [‘何炅‘, ‘杜海海涛‘, ‘周渝?民‘, [‘麻花藤‘, ‘?马芸‘, ‘周笔畅‘]]
4447221448 4447233800

相识python 之小数据池集合

标签：关于处理 ons 类型转换列表 keep 开始编程维基

原文地址：https://www.cnblogs.com/x-h-15029451788/p/11324556.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

相识python 之小数据池 集合

set集合

set 集合增删改查

1.增加

2.删除

修改

查询

常用操作

交集

并集

差集

反交集

子集

超集

深浅拷贝

浅拷?

相识python 之小数据池集合