上千万或上亿的数据,如今的机器的内存应该能存下。所以考虑採用hash_map/搜索二叉树/红黑树等来进行统计次数。然后就是取出前N个出现次数最多的数据了,能够用第2题提到的堆机制完毕。 #include "IOSTREAM" #include<hash_map> #include<string> # ...
分类:
编程语言 时间:
2017-04-24 10:13:39
阅读次数:
219
看过很多面经,里面都会问到海量数据处理的问题。虽然在学校根本遇不到这样的情境,但很多方法还是需要我们去好好了解一下的,也是为了以后的工作做准备吧。 搜集了一些有关海量数据处理的问题和解答,如下: 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时 ...
分类:
其他好文 时间:
2017-04-10 16:33:41
阅读次数:
214
POJ2503 这是一道水题,用Map轻松AC。 不过,可以拿来测一下字符串散列, 毕竟,很多情况下map无法解决的映射问题需要用到字符串散列。 自己生成一个质数, 随便搞一下。 ...
分类:
其他好文 时间:
2017-03-24 00:40:33
阅读次数:
215
这是一节让你深入理解hash_map的介绍,如果你只是想囫囵吞枣,不想理解其原理,你倒是可以略过这一节,但我还是建议你看看,多了解一些没有坏处。 hash_map基于hash table(哈希表)。哈希表最大的优点,就是把数据的存储和查找消耗的时间大大降低,几乎可以看成是常数时间;而代价仅仅是消耗比 ...
分类:
其他好文 时间:
2016-12-23 00:50:26
阅读次数:
262
Leetcode C#, Hash Map, Two pointers ...
我的错因: 本来改用%f输出,我用了%lf,结果编译器直接判定为错误(一部分编译器认为lf是没有错的)。当时我还以为是hash出错了。。 方法不止一种: 方法 时间 空间 Hash 891ms 596k map<string,int> 2735ms 1316k sort 5000ms+ 30000k ...
分类:
其他好文 时间:
2016-10-06 19:39:24
阅读次数:
187
string hash(Map) list set zset(排序) 1.string 常用命令: set key value ; get key ; getset key value ; mset k1 v1 k2 v2… ; mget k1 k2 ; del k incr/decr key(主键 ...
分类:
其他好文 时间:
2016-08-03 20:17:58
阅读次数:
148
1、POJ 3320 2、链接:http://poj.org/problem?id=3320 3、总结:尺取法,Hash,map标记 看书复习,p页书,一页有一个知识点,连续看求最少多少页看完所有知识点 必须说,STL够屌。。 #include<iostream> #include<cstring> ...
分类:
其他好文 时间:
2016-08-02 23:41:39
阅读次数:
207
可以参考侯捷编著的《STL源码剖析》 STL 中的map 与 hash_map的理解 1、STL的map底层是用红黑树存储的,查找时间复杂度是log(n)级别; 2、STL的hash_map底层是用hash表存储的,查询时间复杂度是常数级别; 3、什么时候用map,什么时候用hash_map? 这个 ...
分类:
其他好文 时间:
2016-07-10 18:16:44
阅读次数:
129
插头dp 感受: 我觉得重点是理解,算法并不是直接想出怎样由一种方案变成另一种方案。而是方案本来就在那里,我们只是枚举状态统计了答案。 看看cdq的讲义什么的,一开始可能觉得状态很多,但其实灰常简单 就像lyd说的,考插头dp的题目就是在考模板2333 (学这个之前连hash_map都没写过2333 ...
分类:
其他好文 时间:
2016-07-08 21:48:52
阅读次数:
351