码迷,mamicode.com
首页 > 其他好文 > 详细

大数据学习文章

时间:2016-01-24 12:55:34      阅读:177      评论:0      收藏:0      [点我收藏+]

标签:

ZooKeeper:

ZooKeeper浅析:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3113923.html

 

HDFS:

MapReduce程序的工作过程: http://www.aboutyun.com/thread-15494-1-2.html

HDFS小文件处理解决方案总结:http://www.aboutyun.com/thread-14227-1-1.html

Hadoop 学习总结之一:HDFS简介:http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html

 

 

 

MapReduce


hadoop杂记-为什么会有Map-reduce v2 (Yarn):http://www.cnblogs.com/LeftNotEasy/archive/2012/02/18/why-yarn.html

YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework:http://blog.csdn.net/colorant/article/details/9146201

 

 

MapReduce程序的工作过程: http://www.aboutyun.com/thread-15494-1-2.html

Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解:http://blog.csdn.net/yczws1/article/details/19178265

hadoop学习WordCount+Block+Split+Shuffle+Map+Reduce技术详解:http://blog.csdn.net/yczws1/article/details/21899007

MapReduce调度与执行原理系列文章

一、MapReduce调度与执行原理之作业提交

二、MapReduce调度与执行原理之作业初始化

三、MapReduce调度与执行原理之任务调度

四、MapReduce调度与执行原理之任务调度(续)

JobTracker作业启动过程分析:http://blog.csdn.net/androidlushangderen/article/details/41356521

Hadoop集群作业调度算法

浅析 Hadoop 中的数据倾斜:http://my.oschina.net/leejun2005/blog/100922

Hadoop源码解析之: TextInputFormat如何处理跨split的行:http://blog.csdn.net/bluishglc/article/details/9380087

 

hive:

hive基本操作:http://www.aboutyun.com/thread-6867-1-1.html

hive组件和执行过程:http://blog.csdn.net/lifuxiangcaohui/article/details/40262021

大数据时代的技术hive介绍:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html

Hive体系结构:http://blog.csdn.net/lifuxiangcaohui/article/details/40615843

 深入浅出数据仓库中SQL性能优化之Hive篇

HIVE Group by、join、distinct等实现原理 

 

HBase:
Hadoop核心架构Hbase:http://blog.csdn.net/yczws1/article/details/19178265

HBase系统入门--整体介绍 

Hbase写数据,存数据,读数据的详细过程

Hbase rowkey设计一 

HBase的rowkey设计(含实例)

LSM树由来、设计思想以及应用到HBase的索引 

HBase在搜狐内容推荐引擎系统中的应用  

Hbase建模 

Hbase和Oracle的对比

关于HFile的存储结构梳理以及快速定位rowkey

HBase二级索引方案总结

 

Solr:

Lucene学习总结之一:全文检索的基本原理

Solr学习和总结(线下1)

solr学习2

Solr使用

基于Solr的HBase多条件查询测试

 

ElasticSearch:

ElasticSearch学习1

ES学习2

ElasticSearch使用代码 

修改ES分片规则 

 

Redis:

NoSQL and Redis

redis集群配置

15天玩转redis(mark,redis学习系列) 

 

 

 

 

 

 

 

 

 

 

 

 

Kafka:

快速理解Kafka分布式消息队列框架 

Kafka可靠性的思考

Kafka 之 入门 

Kafka深度解析

flume-kafka-storm日志处理经验

【采集层】Kafka 与 Flume 如何选择

 

Flume1.5.0入门:安装、部署、及flume的案例

 

Storm:

Storm快速理解

从Storm和Spark 学习流式实时分布式计算的设计

 

分布式与集群的区别

 

 

 

 

 

 

大数据学习文章

标签:

原文地址:http://www.cnblogs.com/cxzdy/p/5154876.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!