spark笔记big dataspark 比较Hadoop生态圈:MapReduce Hive Storm Yarn Sqoop Flume HDFSSpark它会代替Hadoop:不能,可能会替代MR炒作 社区比较完善hadoop3.0作者:Doug cutting(hadoop以后也要走内存)S... ...
分类:
其他好文 时间:
2017-04-27 17:48:36
阅读次数:
242
摘要: 在Hadoop生态圈中,针对大数据进行批量计算时,通常需要一个或者多个MapReduce作业来完成,但这种批量计算方式是满足不了对实时性要求高的场景。那Storm是怎么做到的呢? 博主福利 给大家赠送一套hadoop视频课程 授课老师是百度 hadoop 核心架构师 内容包括hadoop入门 ...
分类:
其他好文 时间:
2017-04-25 15:08:59
阅读次数:
179
摘要: 当我们搜集好了庞大的数据,那我们要怎么利用他们来指导推荐系统呢? 博主福利 给大家赠送一套hadoop视频课程 授课老师是百度 hadoop 核心架构师 内容包括hadoop入门、hadoop生态架构以及大型hadoop商业实战案例。 讲的很细致, MapReduce 就讲了 15 个小时。 ...
分类:
其他好文 时间:
2017-04-25 14:54:04
阅读次数:
280
MVVM框架对比
MVC和MVP简介
MVVM
Vue.js、Angular.js、Ember、Backbone等框架对比
双向绑定原理
Virtual DOM
前端由于发展比较迅速,框架的更新迭代也...
分类:
其他好文 时间:
2017-04-21 19:29:24
阅读次数:
270
2011年在海量数据处理领域,Hadoop是人们津津乐道的技术,Hadoop不仅可以用来存储海量数据,还以用来计算海量数据。因为其高吞吐、高可靠等特点,很多互联网公司都已经使用Hadoop来构建数据仓库,高频使用并促进了Hadoop生态圈的各项技术的发展。一般来讲,根据业务需求,数据的处理可以分为离... ...
分类:
其他好文 时间:
2017-04-18 19:15:35
阅读次数:
210
Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成,来展现大数据应用的一个平台,其核心引擎就是Spark,其计算基础是弹性分布式数据集,也就是RDD。通过Spa ...
分类:
其他好文 时间:
2017-04-14 22:56:06
阅读次数:
195
Ambari 是 Apache Software Foundation 的一个顶级开源项目,是一个集中部署、管理、监控 Hadoop 分布式集群的工具。但是这里的 Hadoop 是一个广义概念,并不仅仅指的是 Hadoop(HDFS、MapReduce),而是指 Hadoop 生态圈(包括 Spar ...
分类:
其他好文 时间:
2017-04-13 19:19:39
阅读次数:
446
1.Hive1.1 在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据,同时可以查询hadoop中的数据。 本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具,可以把SQL转换为MapReduce中 ...
分类:
其他好文 时间:
2017-04-09 00:15:55
阅读次数:
258
前言
目前大数据和云计算是当下讨论非常火热的2个词,笔者也非常相信在未来的时间内,以Hadoop系统生态圈为代表的大数据工具,将会被更多的企业所使用。在一些更大规模的公司,已经将大数据与云联系在...
分类:
其他好文 时间:
2017-04-03 18:20:44
阅读次数:
276
今天是2017年3月30 号,处于研一下半学期,既感叹时间过的非常快,又觉得自己学的东西还有好多好多。希望自己后面会更加努力吧。 学了这么久的java,从javaSE到javaEE算是逐渐有些了解了,但老师的项目还完全没有眉目,今天仔细看了下,是java的桌面应用程序,里面的结构框架还没有很清楚,决 ...
分类:
其他好文 时间:
2017-03-30 22:55:00
阅读次数:
147