一、串行爬虫 我们之前使用的爬虫方式,都是一个页面接着一个页面下载,也就是使用串行的方式进行爬虫。但是显然这种方式下载的速度是非常的慢的,特别是当我们需要下载大量页面的时候这个问题就会变得更加的突出。所以本节内,就学习如何进行多线程和多进程的并行爬虫。 二、多线程爬虫 我们在使用多线程进行爬虫的时候 ...
分类:
其他好文 时间:
2018-11-10 17:56:39
阅读次数:
165
题意:给你n个字符串,问你长度为m的字符串且字符串中不含有那n个子串的字符串的数量 解题思路:这道题一开始就不太懂,还以为是组合数学的题目,后面看了别人的博客,才知道这是属于AC自动机的另一种用法,是关于fail数组的运用,因为题目问的是不允许包含那n个字符串,所以我们可以这么想,假设一个trie树 ...
分类:
其他好文 时间:
2018-11-08 19:47:14
阅读次数:
204
题面链接 "洛咕" sol 神题,幸好我不是SD的QAQ。 假设你们都会$O(n^3m^3)$的高斯消元,具体来说就是建出$Trie$图然后套游走的板子。 然后我们发现可以把不能匹配任何串的概率压到一起。 考虑一个不能匹配任何串的$S$。一个串$A_i$获胜当且仅当最后串是这样的:$S+A_i$。 ...
分类:
其他好文 时间:
2018-11-06 23:37:57
阅读次数:
157
题意:有一棵n个结点的只由小写字母组成的Trie树,给定它的具体形态,问删除哪一层后剩下Trie树的结点数最少 n<=3e5 思路:先建出原Trie树,对于每一层的每一个结点计算删除后对答案的贡献,这一部分使用启发式合并 官方题解证明了时间复杂度是一个log的 http://codeforces.c ...
分类:
其他好文 时间:
2018-11-06 19:33:49
阅读次数:
353
[note]一类位运算求最值问题 给定一些数,让你从中选出两个数a,b,每次询问下列中的一个 1.a and b的最大值 2.a xor b的最大值 3.a or b的最大值 神仙们都是FWT,小蒟蒻只好orz 首先三种问题的思路都是从高位往低位贪心 对于xor,直接枚举每个数Trie树上贪心 对于 ...
分类:
其他好文 时间:
2018-11-05 19:11:34
阅读次数:
202
"LINK1" "LINK2" 题目大意 给你一些字符串,并定义了一个函数(具体见题面) 问你把任意两个字符串放到函数里面得到的值的和是多少 思路 该怎么统计答案呢? 每次考虑当前插入的串和所有已经插入过的串一起统计答案 然后考虑一下怎么统计,假设当前深度是dep 并且现在是u,即将向v移动指针 那 ...
分类:
其他好文 时间:
2018-11-04 19:07:23
阅读次数:
144
字符串 知识点 AC自动机 把多个串插入一个自动机里进行匹配,其实建好的是Trie图 cpp void Add(char s,int op) { int x=0,len=strlen(s+1); for(int i=1;i ...
分类:
其他好文 时间:
2018-11-04 15:39:26
阅读次数:
180
<题目链接> 题目大意:给定一个只有小写字母组成的目标串和m个模式串(里面可能有大写字母),记目标串反过来后的串为S,让你从m个模式串中选出若干个组成S串(不区分大小写)。输出任意一种方案。 解题分析:将所有单词倒着建好Trie树后(字母忽略大小写),直接在Trie树上跑DFS,记录下所有符合条件的 ...
分类:
其他好文 时间:
2018-11-03 17:35:25
阅读次数:
87
用所有合法序列的方案数减不包含题目中要求的子序列的合法序列数 后者用AC自动机维护一下dp就好 ...
分类:
其他好文 时间:
2018-11-02 20:30:09
阅读次数:
177
Java中的数组在内存中的图解,其实对于数组,还是比较熟悉的,平时用的也是很多的,在看数据结构与算法的极客时间专栏,最常用的10个数据结构:数组、链表、栈、队列、散列表、二叉树、堆、跳表、图、Trie树,其中数组是最基础,也是学起来最简单的一种数据结构,数组是一种线性表数据结构。它用一组连续的内存空 ...
分类:
编程语言 时间:
2018-10-31 23:31:16
阅读次数:
406