谈到大数据框架,现在最火的就是Hadoop和Spark,但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,倒底现在业界都在使用哪种技术?二者间究竟有哪些异同?它们各自解决了哪些问题?下面不妨跟我一块看下它们究竟有什么异同。 解决问题的层面不一样 首先,Hadoop和Apache S ...
分类:
其他好文 时间:
2016-09-13 23:51:16
阅读次数:
242
memcached:高性能的分布式内存缓存服务器 storm:分布式实时大数据流式计算系统 ZooKeeper:是一个开放源码的分布式应用程序协调服务 hadoop:基于磁盘和分布式文件系统的,能够对大量数据作分布式批处理的大数据框架 ZooKeeper:是一个开放源码的分布式应用程序协调服务 ha ...
分类:
其他好文 时间:
2016-07-31 11:40:04
阅读次数:
168
需要学习和掌握的知识 1. 后端 1.1 服务器 1.1.1 linux命令 1.1.2 nginx 1.1.3 jetty 1.1.4 docker 1.1.5 ElasticSearch 1.2 大数据框架 1.2.1 hadoop 1.2.2 Yarn 1.2.3 flume 1.2.4 St... ...
分类:
其他好文 时间:
2016-07-06 21:43:57
阅读次数:
141
大数据,无论是从产业上,还是从技术上来看,都是目前的发展热点。在中国,政府控制着80%的数据,剩下的多由“BAT”这样的大公司拥有,中小企业如何构建自己的大数据系统?其他企业如何建设自己的大数据系统?推荐两大应用最广泛、国人认知最多的Apache开源大数据框架系统:spa..
分类:
其他好文 时间:
2016-06-16 13:24:34
阅读次数:
178
Spark大数据框架是用scala语言编写,和java有些不同又比java强大、灵活,库的封装实现了很多算法函数,scala中的的接口用trait来定义,不同于java的接口,trait中可以有抽象方法也可以有不抽象方法。scala中的方法中还可以定义方法,这在java中是从来没有的。传统的MR需要...
分类:
其他好文 时间:
2015-12-19 13:38:55
阅读次数:
210
谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考......
分类:
其他好文 时间:
2015-12-17 10:56:49
阅读次数:
160
大数据何止是大,未来的世界应该是数据大爆炸,掌握数据的人才能掌握未来!模拟用户轨迹,行为分析,市场预测,spark基于内存的大数据框架。图计算,机器学习,docker,hadoop,spark,flink,,,让我们一起来追寻spark,进入大数据时代!!!spark 大数据是用scala语言,sc...
分类:
其他好文 时间:
2015-11-18 16:24:33
阅读次数:
222
java框架整合Springmvc+mybatis+shiro+lucene+rest+webservice+maven 1. 使用阿里巴巴Druid连接池(高效、功能强大、可扩展性好的数据库连接池、监控数据库访问性能、支持Common-Logging、Log4j和JdkLog,监控数据库访问) ...
分类:
编程语言 时间:
2015-06-01 06:10:04
阅读次数:
613
Scala是一门以JVM为目标运行环境并将面向对象和函数式编程语言的最佳特性结合在一起的编程语言,此课程是大数据框架Spark的前置课程:1, Spark框架是采用Scala语言编写的,精致而优雅。要想成为Spark高手,你就必须阅读Spark的源代码,就必须掌握Scala;2, 虽然说现在的Spa...
分类:
编程语言 时间:
2014-12-24 22:41:22
阅读次数:
188
Scala是一门以JVM为目标运行环境并将面向对象和函数式编程语言的最佳特性结合在一起的编程语言,此课程是大数据框架Spark的前置课程:1,Spark框架是采用Scala语言编写的,精致而优雅。要想成为Spark高手,你就必须阅读Spark的源代码,就必须掌握Scala;2,虽然说现在的Spark...
分类:
编程语言 时间:
2014-12-23 06:39:06
阅读次数:
329