标签:针对 pytho unicode 类型 col set集合 二进制 采集 哈希
编码utf-8-8-bit Unicode Transformation Format,针对Unicode的可变长度字符编码
ascii码:American Standard Code for Information Interchange,美国信息交换标准代码
set集合,不允许重复的元素出现
访问速度快,解决了重复问题
创建:通过类来创建
s1 = set()
s1.add(‘aaa‘)
print(s1)
s1.add(‘ccc‘)
print(s1)
爬虫:请求页面,拿到源码,把元素拿过来,找商品名称,找价格
爬虫有入口,找所有的链接,访问过就放set里面
最后 判断set里有没有url就可以了;
cmdb:采集硬件资产
交集、差集
s1 = set([11,22,33])
s2 = set([44,55])
collections系列,集合
Counter 计数器,对字典类型补充,对值出现的次数的统计,继承了collection类
a = collections.Counter(‘aaaafdsfdsfsdfds‘)
print(a)
有序字典orderedDict
标签:针对 pytho unicode 类型 col set集合 二进制 采集 哈希
原文地址:http://blog.51cto.com/11test/2069562