今日所得 元组及内置方法 字典及内置方法 集合及内置方法 字符编码 元组(有序) 作用:和列表类似可存储多个值,但是元组本身不能改变,一旦生成元组里面的元素也不可能以改变,元素和元素用逗号隔开,元素可以是任意类型 需要掌握的操作: 字典(无序) 作用:能存储多对键值对(key:value),key是 ...
分类:
其他好文 时间:
2019-07-04 21:27:05
阅读次数:
132
HDU - 6122 我们能分析出来不可能列和行有连续一样的数字, 所以我们能得出图形是由ABABAB 和 BABABA 这两种形式的东西叠在一起构成的, 要么是一列一列叠出来, 要么一行一行叠出来, 最后减去重复的, 也就是所有相邻数字都不一样的。 ...
分类:
其他好文 时间:
2019-07-04 12:52:16
阅读次数:
86
import pandas as pdimport numpy as npfrom pandas import Series,DataFrame#重命名DataFrame的indexdf1 = DataFrame(np.arange(9).reshape(3,3),index=["BJ","SH", ...
分类:
编程语言 时间:
2019-07-04 11:24:14
阅读次数:
106
一.全站爬取(CrawlSpider) 1.基本概念 2.项目示例 ①.爬取抽屉网多页数据对象 ②爬取阳光热线 多页及详情页数据,持久化存储 二.分布式 1.基本概念 2.实现流程 3.示例(阳光热线的爬取): 三.增量式爬虫 1.对url去重(爬取4567电影网数据) 2.对数据的去重(糗事百科) ...
分类:
其他好文 时间:
2019-07-04 09:42:08
阅读次数:
85
list去重 方法1:利用循环去重 方法2:利用字典去重 方法3:set去重,再转化成list 方法4:通过删除index 方法5:利用reduce、lambda函数去重 ...
分类:
其他好文 时间:
2019-07-03 10:25:40
阅读次数:
95
数据过滤在很多场景都会应用到,特别是在大数据环境下。在数据量很大的场景实现过滤或者全局去重,需要存储的数据量和计算代价是非常庞大的。很多小伙伴第一念头肯定会想到布隆过滤器,有一定的精度损失,但是存储性能和计算性能可以达到几何级别的提升。很多第三方框架也实现了相应的功能,比如hbase框架实现的布隆过 ...
分类:
其他好文 时间:
2019-06-30 14:02:23
阅读次数:
134
#定义集合:{},集合是只有key没有value的字典,集合内元素不能重复!a={1,2,3,4,5,6}#列表转换成集合b=set([1,2,3,4,5])print(a,b) #集合对列表进行去重list1=[1,1,2,2,3,4,5,6,7,8]#转换成集合x=set(list1)#还原成列 ...
分类:
编程语言 时间:
2019-06-29 15:12:02
阅读次数:
137
最近在面试,侥幸面试成功,这里列举一下数组去重的方法这里我们先随机生成一个10000项的数组,通过不同方法的对数组进行去重,来比较一下速度。 首先生成数组 1.首先是通过双循坏的方法 声明一个新的空数组,每次对新数组进行检索,如果查不到,则将元素插入。时间复杂度为O(n2)贴上代码 2.这种思路是先 ...
分类:
编程语言 时间:
2019-06-28 18:15:35
阅读次数:
154