Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark当下已成为Apache基金会的顶级开源项目,拥有着庞大的社区支持(活跃开发者人数已超过Ha...
分类:
其他好文 时间:
2015-07-06 19:18:38
阅读次数:
142
一般我们的最大流算法解决的是最优化问题。即通过某种构图方法,使得最大流的流量即为我们所要求的的最大值。但是,一类判定性问题也需要通过网络流模型来解决。经典的问题有:混合图的欧拉回路,等等。这类问题往往通过构建一个网络图,计算出其最大流,然后根据判断最大流是否满足某种条件来判断。当然,二分答案的时候也...
分类:
其他好文 时间:
2015-07-06 12:01:09
阅读次数:
120
??
给出一个柱形统计图中,求其中的最大矩形面积
做完这道题,搜了一下题解大部分基本都是单调栈......然而做之前并不知道这是什么,其实用递推也可以做这道题,理解起来比较容易。
用两个数组l,r记录当前坐标可以向左和向右延伸的最远位置的坐标,然后就是递推了。
初始时将l[i],r[i]的值置为i,即自己的坐标。这里拿l[i]举例:
从左向右扫描统计图,计算当前位置的l[i]时,如果...
分类:
其他好文 时间:
2015-06-30 22:04:13
阅读次数:
193
基于社交网络的情绪化分析IIIBy 白熊花田(http://blog.csdn.net/whiterbear) 转载需注明出处,谢谢。前面进行了微博数据的抓取,简单的处理,这一篇进行学校微博的相似度分析。微博相似度分析这里试图计算任意两个学校之间的微博用词的相似度。思路:首先对学校微博进行分词,遍历获取每个学校的高频用词词典,组建用词基向量,使用该基向量构建每个学校的用词向量,最后使用TF-IDF算...
分类:
其他好文 时间:
2015-06-28 17:36:26
阅读次数:
160
Spark简述Spark发源于美国加州大学伯克利分校AMPLab的集群计算平台。它立足
于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式。
特点:
1、轻
Spark 0.6核心代码有2万行,Hadoop1.0为9万行,2.0为22万行。2、快
Spark对小数据集能达到亚秒级的廷迟,这对于Hadoop MapReduce是无法想象的(由于”心跳”间隔机制,...
分类:
其他好文 时间:
2015-06-24 21:03:48
阅读次数:
412
GraphLab介绍GraphLab 是由CMU(卡内基梅隆大学)的Select 实验室在2010 年提出的一个基于图像处理模型的开源图计算框架,框架使用C++语言开发实现。该框架是面向机器学习(ML)的流处理并行计算框架,可以运行在多处理机的单机系统、集群或是亚马逊的EC2 等多种环境下。框架的设计目标是,像MapReduce一样高度抽象,可以高效执行与机器学习相关的、具有稀疏的计算依赖特性的迭代...
分类:
其他好文 时间:
2015-06-08 21:35:42
阅读次数:
461
一、SambaSamba是SMB的一种实现方法,主要用来实现Linux系统的文件和打印服务。Linux用户通过配置使用Samba服务器可以实现与Windows
用户的资源共享。守护进程smbd和nmbd是Samba的核心,在全部时间内运行。nmbd程序使得通过企图计算机可以浏览Linux服务器。1、Samba的安装我们..
分类:
系统相关 时间:
2015-05-31 18:41:30
阅读次数:
638
同上篇讲述pageRank一样,考虑一个顶点V。根据顶点算法通常步骤1) 接收上个超步发出的入邻居的消息2) 计算当前顶点的值3) 向出邻居发消息1、接受入邻居的消息2、求其中最小值,即为V的值value3、向V的出邻居发送消息,消息为value + 到邻居的距离double val = 0.0;f...
分类:
编程语言 时间:
2015-05-20 18:05:54
阅读次数:
130
给出 n 个非负整数,代表一张X轴上每个区域宽度为 1 的海拔图,
计算这个海拔图最多能接住多少(面积)雨水。
样例
如上图所示,海拔分别为 [0,1,0,2,1,0,1,3,2,1,2,1],
返回 6.
挑战
O(n) 时间, O(1) 空间
O(n) 时间, O(n) 空间也可以接受
分析:只能遍历一遍,且不能存储所有的高度,一块直柱能接的...
分类:
其他好文 时间:
2015-05-15 13:45:30
阅读次数:
263
提纲题目要求程序代码结果图片要言妙道题目要求:收集三种光照条件下的手的直方图,计算它们之间的EMD距离程序代码: 1 // OpenCVExerciseTesting.cpp : 定义控制台应用程序的入口点。 2 // 3 //D:\\Work\\Work_Programming\\Sourc...
分类:
其他好文 时间:
2015-05-09 16:10:42
阅读次数:
1330