大数据:大数据之好书推荐1.
解读大数据想全面了解大数据的方方面面,绝对不能错过《大数据时代—生活、工作与思维的变革》这本书。一本很容易读懂的书,不需要过多的专业知识,里面的每个点能让你有这样一种冲动——如果我把这个点不断扩大,是不是我就是下一个Facebook!非专业人员请不要有什么顾虑,即使你对...
分类:
其他好文 时间:
2014-06-16 08:58:56
阅读次数:
182
这道题网上很多人都会说容易,水题之类的话,不过我看了下说这样的话的人的程序,可以说他们的程序都不及格!
为什么呢?因为他们的程序都是使用简单的二次排序水过(大概你能搜索到的多是这样的程序),那样自然可以说不及格了。
因为本题真正的目的是求前k个最大数的问题,这就需要活用快速排序。
求前k个最大数的思路:
1 选取一个数位轴,然后把大于这个数的数放到数列前面,小于这个数的数放到数列后面
2 如果前面的数的数量大于k,那么可以去掉后面的数,递归在前面的数查找前k个最大数
3 如果前面的数的数量小于k,那么截去前...
分类:
其他好文 时间:
2014-06-15 18:04:07
阅读次数:
181
经过大牛同事的一句指点立刻明白的代理实现方式,Spring Aop应该也是这么去做的。直接上代码
实现在Car的run方法之前调用star方法,在run方法之后调用stop方法。
Car类
package com.lubby.test;
public class Car {
public void run() {
System.out.println("I am running......
分类:
编程语言 时间:
2014-06-15 08:48:20
阅读次数:
240
这道题想的时候颇费了一些周折,想过把L的所有concatenation组合出来,放到hash或map里,然后遍历S的时候直接看。但是这样如果L的size: Lsize过大的话,可能的组合有Lsize!种,组合数剧增,效率低下,所以不采用这种方法。又考虑在S中从左向右一个word一个word遍历过去,...
分类:
其他好文 时间:
2014-06-14 09:07:00
阅读次数:
252
过程是这样的:最近一直想做一个头像的mask效果,后来发现原来unity的mask需要用shader来写,网上找了不少资料,也能实现,不过大多数都是用render
texture作为相机投影的texture。然后把这个相机的图像作为一个material,然后在ngui中创建一个texture,把这个...
分类:
其他好文 时间:
2014-06-13 17:07:33
阅读次数:
244
使用IP欺骗功能时,需要将系统防火墙,杀毒软件关闭(如果有影响的话)一、为什么要设置IP欺骗1、
当某个IP的访问过于频繁,或者访问量过大时,服务器会拒绝访问请求,这时候通过IP欺骗可以增加访问频率和访问量,以达到压力测试的效果。2、
某些服务器配置了负载均衡,使用同一个IP不能测出系统的实际性能。...
分类:
其他好文 时间:
2014-06-13 16:59:18
阅读次数:
259
Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成,来展现大数据应用的一个平台,其核心引擎就是Spark,其计算基础是弹性分布式数据集,也就是RDD。通过Spark生态圈,AMPLab运用大数据、云计算、通信等各种资源,以及各种灵活的技术方案,对海量不透明的数...
分类:
其他好文 时间:
2014-06-11 06:59:31
阅读次数:
288
练习一万个小时就行了吗?事实并不是这样的,需要好的方法。同样的时间出现不同的结果。随着畅销书《异类》的流行,“练习一万小时成天才”这个口号现在是尽人皆知。也许仍然有不少人相信那些不世出的天才必有天生的神秘能力,但科学家通过大量的调查研究已经达成共识,那就是所有顶级高手都是练出来的。不但如此,最近几年...
分类:
其他好文 时间:
2014-06-10 21:50:44
阅读次数:
267
在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通.....
分类:
其他好文 时间:
2014-06-10 16:20:58
阅读次数:
305
是不是常常要分析用户的行为?是不是常常遇到多台服务器上传的日志一起分析?是不是对数据统计的间隔时间要求很短?还有木有因为日志文件过大,而需要分块处理?
1、说明一点在日志写入的时候必须按照一种严格的格式,这样在做解析的时候,才好切割。比如 gameid:123 gameid:2333。切割统一标准就行。
2、在生成日志的文件名的时候也要按照一定规则,在分析的时候,正则表达式好匹配,如 服务器hostname_date.log 这样在匹配的时候 只需要 glob(*—date.log); //glob...
分类:
数据库 时间:
2014-06-08 10:38:43
阅读次数:
335