标签:
8.字符串的处理
python join 和 split方法的使用,join用来连接字符串,split恰好相反,拆分字符串的。
1.join用法示例
>>>li = [‘my‘,‘name‘,‘is‘,‘bob‘]
>>>‘ ‘.join(li)
‘my name is bob‘
>>>‘_‘.join(li)
‘my_name_is_bob‘
>>> s = [‘my‘,‘name‘,‘is‘,‘bob‘]
>>> ‘ ‘.join(s)
‘my name is bob‘
>>> ‘..‘.join(s)
‘my..name..is..bob‘
2.split用法示例
>>> b = ‘my..name..is..bob‘
>>> b.split()
[‘my..name..is..bob‘]
>>> b.split("..")
[‘my‘, ‘name‘, ‘is‘, ‘bob‘]
>>> b.split("..",0)
[‘my..name..is..bob‘]
>>> b.split("..",1)
[‘my‘, ‘name..is..bob‘]
>>> b.split("..",2)
[‘my‘, ‘name‘, ‘is..bob‘]
>>> b.split("..",-1)
[‘my‘, ‘name‘, ‘is‘, ‘bob‘]
可以看出 b.split("..",-1)等价于b.split("..")
s为字符串
s.isalnum() 所有字符都是数字或者字母
s.isalpha() 所有字符都是字母
s.isdigit() 所有字符都是数字
s.islower() 所有字符都是小写
s.isupper() 所有字符都是大写
s.istitle() 所有单词都是首字母大写,像标题
s.isspace() 所有字符都是空白字符
判断是整数还是浮点数
a=123
b=123.123
>>>isinstance(a,int)
True
>>>isinstance(b,float)
True
>>>isinstance(b,int)
False
一:字符串的截取
python的字符串是有序集合,我们可以通过索引来提取想要获取的字符,可以把python的字符串也做为字符串的列表就更好理解
python的字串列表有2种取值顺序:
第一种是从左到右索引默认0开始的,最大范围是字符串长度少1
s = ‘ilovepython‘
s[0]的结果是i
第二种是从右到左索引默认-1开始的,最大范围是字符串开头
s = ‘ilovepython‘
s[-1]的结果是n
上面这个是取得一个字符,如果你的实际要取得一断字符的话,可以用到python 字符串截取功能,比如:
s = ‘ilovepython‘
s[1:5]的结果是love
当使用以冒号分隔的字符串,python返回一个新的对象,结果包含了以这对偏移标识的连续的内容,左边的开始是包含了下边界,比如上面的结果包含了s[1]的值l,而取到的最大范围不包括上边界,就是s[5]的值p
多举几个里例子让大家更明白点:
s[:3]
结果是‘ilo‘,省掉:左边的话,默然左边开始的索引值是0,其实这个表达式和s[0:3]的意思是一样的。
s[:-1]
结果是:‘ilovepytho‘ 就是左边开始的索引值是0,最大范围到字符串里的最后一个字符但是不包括最后一个字符。
s[:]
结果是:‘ilovepython‘ 获取了从偏移0到末尾之间的元素,这是python 字符串拷贝
二:字符串的替换
python 字符串替换是python操作字符串的时候经常会碰到的问题,这里简单介绍下字符串替换方法。
python 字符串替换可以用2种方法实现:
1、用字符串本身的方法
2、用正则来替换字符串
下面用个例子来实验下:
a = ‘hello word‘
我把a字符串里的word替换为python
1、用字符串本身的replace方法
a.replace(‘word‘,‘python‘)
输出的结果是hello python
2、用正则表达式来完成替换:
import re
strinfo = re.compile(‘word‘)
b = strinfo.sub(‘python‘,a)
print b
输出的结果也是hello python
python中用string.maketrans和translate巧妙替换字符串
将nginx日志中字符串 [2013-07-03T00:29:40-05:00] HTTP 格式化为:"2013-07-03 00:29:40-05:00"
整条日志如下:
92.82.22.46 - - [2013-07-03T00:29:40-05:00] "GET /images/mask_bg.png HTTP/1.1" 200 195 "http://www.chlinux.net/" "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)" "-"
将[2013-07-03T00:29:40-05:00] 替换成为:"2013-07-03 00:29:40-05:00"
把[]换成"",然后把T替换成空格
>>> s=‘‘‘92.82.22.46 - - [2013-07-03T00:29:40-05:00] "GET /images/mask_bg.png HTTP/1.1" 200 195 "http://www.chlinux.net/" "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)" "-"‘‘‘
>>> table = string.maketrans(‘[]‘,‘""‘)
>>> s.translate(table)
‘92.82.22.46 - - "2013-07-03T00:29:40-05:00" "GET /images/mask_bg.png HTTP/1.1" 200 195 "http://www.chlinux.net/" "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)" "-"‘
>>> s.translate(table).replace(‘T‘, ‘ ‘,1)#替换掉第一个T为空格
‘92.82.22.46 - - "2013-07-03 00:29:40-05:00" "GET /images/mask_bg.png HTTP/1.1" 200 195 "http://www.chlinux.net/" "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)" "-"‘
也可以这样:
>>> table = re.sub(‘\[|\]‘,‘"‘,s).replace(‘T‘, ‘ ‘,1)
>>>print table
‘92.82.22.46 - - "2013-07-03 00:29:40-05:00" "GET /images/mask_bg.png HTTP/1.1" 200 195 "http://www.chlinux.net/" "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)" "-"‘
(1)append方法
(2)insert方法
(3)extend方法
(4)index方法
(6)pop方法
创建连续的list
list的方法
list 操作符:,+,*,关键字del
list的复制
1.列表按列排序 list sorted
如果列表的每个元素都是一个元组(tuple),我们要根据元组的某列来排序的化,可参考如下方法
下面例子我们是根据元组的第2列和第3列数据来排序的,而且是倒序(reverse=True)2.列表去重 set(list)
有时候需要将list中重复的元素删除,就要使用如下方法
lst= [(1,‘sss‘),(2,‘fsdf‘),(1,‘sss‘),(3,‘fd‘)]Python中的列表(list)类似于C#中的可变数组(ArrayList),用于顺序存储结构。
创建列表
sample_list = [‘a‘,1,(‘a‘,‘b‘)]
Python 列表操作
sample_list = [‘a‘,‘b‘,0,1,3]
得到列表中的某一个值
value_start = sample_list[0]
end_value = sample_list[-1]
删除列表的第一个值
del sample_list[0]
在列表中插入一个值
sample_list[0:0] = [‘sample value‘]
得到列表的长度
list_length = len(sample_list)
列表遍历
for element in sample_list:
print(element)
Python 列表高级操作/技巧
产生一个数值递增列表
num_inc_list = range(30)
#will return a list [0,1,2,...,29]
用某个固定值初始化列表
initial_value = 0
list_length = 5
sample_list = [ initial_value for i in range(10)]
sample_list = [initial_value]*list_length
# sample_list ==[0,0,0,0,0]
一、元组特性
1、类似列表,但不可变类型,正因如此,它可以做一个字典的key
2、当处理一组对象时,这个组默认是元组类型(老写错"元祖")
3、所有的多对象,逗号分隔的,没有明确用符号定义的这些都默认为元组类型
>>> ‘abc‘,1,2,‘x‘,True
(‘abc‘, 1, 2, ‘x‘, True) >>> x,y =1,2 >>> x,y (1, 2) ----------------------------- def foo1(): return obj1,obj2,obj3 def foo2(): return [obj1,obj2,obj3] def foo3(): return (obj1,obj2,obj3)
4、逗号不要少,尽量都写,即使只有一个元素
>>> type((‘x‘)) <type ‘str‘> >>> type((‘x‘,)) <type ‘tuple‘> >>> tup = (‘x‘) >>> type(tup) <type ‘str‘> >>> tup = (‘x‘,) >>> type(tup) <type ‘tuple‘>
1. 无法向元组添加元素。元组没有 append() 或 extend() 方法。
2. 不能从元组中删除元素。元组没有 remove() 或 pop() 方法。
3. 可以 在元组中查找元素,由于该操作不改变元组。
4. 还可以使用 in 运算符检查某元素是否存在于元组中。 那么元组有什么好处呢?
• 元组的速度比列表更快。如果定义了一系列常量值,而所需做的仅是对它进行遍历,那么请使用元组替代列表。
• 对不需要改变的数据进行“ 写保护” 将使得代码更加安全。使用元组替代列表就像是有一条隐含的 assert 语句显示该数据是
• 一些元组可用作字典键(特别是包含字符串、数值和其它元组这样的不可变数据的元组)。列表永远不能当做字典键使用,因为列表不是不可变的。
10.字典的使用
一、映射类型
我理解中的映射类型是:键值对的关系,键(key)映射值(value),且它们是一对多的关系。
字典是Python唯一的映射类型。
扩展1:哈希表
一种数据结构,值是根据相关的键进行数据存储的,形成"键-值对"(key-value pairs),哈希表中的值是没有顺序的。
扩展2:映射类型与序列类型的区别
1):访问方式不同,序列类型用数字类型的键,而映射类型可以用其他对象类型做键(一般式字符串)
>>> lis = [‘a‘,‘b‘,‘c‘] >>> lis[2] ‘c‘ >>> dic = {‘name‘:‘a‘,‘father‘:‘b‘,‘mother‘:‘c‘} >>> dic[‘mother‘] ‘c‘
2):存储类型不同,映射类型的键,直接或间接地与值相关。
3):序列类型,有序之列;映射类型则无序之列
二、字典
1、工厂方法dict():
>>> tu=([‘a‘,‘b‘],[‘xx‘,‘yy‘]) >>> tu ([‘a‘, ‘b‘], [‘xx‘, ‘yy‘]) >>> fdict = dict(tu) >>> fdict {‘a‘: ‘b‘, ‘xx‘: ‘yy‘}
2、访问形式:
>>> dic {‘father‘: ‘b‘, ‘name‘: ‘a‘, ‘mother‘: ‘c‘} >>> for obj in dic: print obj father name mother >>> for obj in dic.keys(): print obj father name mother >>> for obj in dic.values(): print obj b a c >>> for obj in dic.items(): print obj
(‘father‘, ‘b‘) (‘name‘, ‘a‘) (‘mother‘, ‘c‘) >>>
3、has_key()、in、not in来检查是否有某个键,has_key()已慢慢弃用了。
4、有则更新,无则添
5、删除
del dic[‘name‘] #删除元素del dic #删除整个
6、操作符
[]、和 in、not in
>>> if‘name‘in dic: print dic[‘name‘] a
7、相关函数
dict():创建字典
len():返回键值对数目
hash(obj):返回obj的哈希值
8、内建方法
dict.clear():删除字典中所有元素
dict.copy():浅copy
dict.formkeys():创建字典
dict.get(key,default=None):返回对应键值
dict.has_key():键是否存在
dict.items():返回字典中键值对元祖的列表
dict.keys():键的列表dict.values():值的列表
......
>>> dic.keys() [‘father‘, ‘name‘, ‘mother‘] >>> dic.values() [‘b‘, ‘a‘, ‘c‘] >>> dic.get(‘name‘) ‘a‘
三、注意
1、不允许一个键对应多个值,一个键只能对应一项
2、当键发生冲突时,取最后一个。
3、Python不会检查键的冲突,也不会因为键的冲突而产生错误,如果检查每个键是否冲突势必会占用很多内存。
>>> dic={‘a‘:‘ss‘,‘a‘:"xxxx"} >>> dic {‘a‘: ‘xxxx‘}
4、键必须是可哈希的。
所有不可变类型都是可哈希的,不可变类型如(列表、字典)则不能。
不可变类型:string,integer,tuple、
可变类型:list,dict
5、值相同的数字表示相同的键,如1和1.0的哈希值是相同的,因此它们是相同的键。
>>> dic={1:‘a‘,1.0:‘b‘} >>> dic {1: ‘b‘}
标签:
原文地址:http://www.cnblogs.com/muzinan110/p/4906792.html