给一个数组queries,queries[j]=[p, q, limit],你的任务是对于每个查询,判断是否存在从 p 到 q 的路径,且这条路径上的每一条边都 严格小于 limit。 2 ? n ? 105 1 ? edgeList.length, queries.length ? 105 思路: ...
分类:
其他好文 时间:
2020-12-25 11:59:48
阅读次数:
0
给定长度为 $n$ 的数列,每个数都在 $[1,n]$ 间,回答 $m$ 个询问,每次给定一个区间 $[l,r]$,问其中有多少对数间存在倍数关系。 ...
分类:
编程语言 时间:
2020-09-11 14:19:51
阅读次数:
42
先庆祝一下itest 入选tid 2020 IT研发管理工具选型手册。基本流程: (1)BaseUrl 设置------>(2)基础认证设置 ----->(3)维护接口用例----->(4)建接口测试场景(可在迭代中直接增加)--->(5)手动执行接口测试场景(可单个,也可一键执行场景中所有接口)... ...
分类:
其他好文 时间:
2020-08-12 16:01:42
阅读次数:
88
恢复内容开始 大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spark,mapReducehe和Spark之间的最大区别是前者较偏向于离线处理,而后者重视实现性,下面主要介绍mapReducehe和Spark两者的shuffle过程。 MapReduce的Shuffle ...
分类:
其他好文 时间:
2020-06-08 19:17:29
阅读次数:
88
发现可以模拟Kruscal算法,一开始所有点在只包含自己的集合中,然后按照边长从小到大依次合并,每次合并如果发现这条边的两个端点不在同一个集合中,那么答案就加上这两个端点分属的两个集合中的点数相乘。 多次询问,考虑离线处理,答案按l从小到大排序,处理完后再按输入顺序排序输出。 1 #include< ...
分类:
其他好文 时间:
2020-05-09 23:43:36
阅读次数:
102
前言 目前仅在一家公司做过大数据相关,也不太清楚其他公司情况。东家这常用的大数据离线处理基本就是sqoop导入到hive中,然后使用spark或者hive计算出结果再导出到oracle中。很多情况下是把oracle中整个表或者某个时间条件的筛选出来的数据整个删掉,再把最新的这部分数据全部导数回到or ...
分类:
数据库 时间:
2020-05-05 21:59:35
阅读次数:
102
tarjan算法:离线处理询问,核心思想是并查集。 如该图,现有4个询问:6-7,6-9,7-10,2-11 实现:1.先把询问数翻倍,除了本身的询问,还要增加两个点反过来的询问,即7-6,9-6,10-7,11-2。为什么要这样?因为在询问时,不知道两个点的先后顺序。 2.从根结点出发,做dfs遍 ...
分类:
其他好文 时间:
2020-03-17 12:41:50
阅读次数:
69
因为想要通过hive作为数据库来保存爬取后和处理完成的数据,需要添加spark的hive支持,这方面还没编译完,所以今天暂时没有这方面的进度,所以写写SparkSteaming。 数据的价值随着时间的流逝而减少 这也正是MapReduce的使用范围所产生的的极大弊端,没法应对大流量的实时数据,MR这 ...
分类:
其他好文 时间:
2020-02-02 21:59:34
阅读次数:
95
~~智障如我~~ 看题解看了半天才懂 其实就是一道莫比乌斯反演+离线处理+树状数组维护前缀和的题目 上代码 ...
分类:
其他好文 时间:
2020-01-28 14:10:25
阅读次数:
72
"B题地址:树上逆序对" 有两个思路 方法一:线段树离线 + 树状数组或者线段树维护区间和 0:离散化,离线存储输入的operation操作序列。 ①:先线段树在dfs序上离线处理好整一棵树:在dfs序上先查询"加入当前结点的逆序对权值和"并记录,再加入当前这个节点;dfs完毕后,就已经记录好每个结 ...
分类:
编程语言 时间:
2020-01-25 16:55:25
阅读次数:
91