标签:style http io ar color os 使用 sp for
http://www.chinahadoop.cn/page/developer
什么是大数据开发师?
围绕大数据系平台系统级的研发人员, 熟练Hadoop、Spark、Storm等主流大数据平台的核心框架。深入掌握如何编写MapReduce的作业及作业流的管理完成对数据的计算,并能够使用Hadoop提供的通用算法, 熟练掌握Hadoop整个生态系统的组件如: Yarn,HBase、Hive、Pig等重要组件,能够实现对平台监控、辅助运维系统的开发。
通过学习一系列面向开发者的Hadoop、Spark等大数据平台开发技术,掌握设计开发大数据系统或平台的工具和技能,能够从事分布式计算框架如Hadoop、Spark群集环境的部署、开发和管理工作,如性能改进、功能扩展、故障分析等。
Follow the developer path:
1、《hadoop大数据平台基础》
第1周 Hadoop生态系统概述以及版本演化
概要介绍Hadoop生态系统及其版本演化历史,并给出hadoop版本选择建议。
第2周 HDFS 2.0 原理、特性与基本架构
介绍HDFS 2.0原理与架构,并与HDFS 1.0进行对比。介绍HDFS 2.0新特性,包括快照、缓存、异构存储架构等
第3周 YARN应用场景、基本架构与资源调度
介绍YARN是什么、基本原理与架构,并剖析其调度策略。
第4周 MapReduce 2.0基本原理与架构
介绍计算框架MapReduce基本原理与架构
第5周 MapReduce 2.0编程实践(涉及多语言编程)
手把手介绍如何用java、C++、php等语言编写MapReduce程序
第6周 HBase应用场景、原理与基本架构
介绍HBase应用场景、原理和架构
第7周 HBase编程实践(涉及多语言编程)
手把手介绍如何用Java、C++、Python等语言编写HBase客户端程序。
第8周 HBase案例分析
介绍几个HBase典型应用案例,包括互联网应用案例和银行应用案例。
第9周 Zookeeper部署及典型应用
介绍Zookeeper是什么,在hadoop生态系统中的地位
第10周 Hadoop数据入库系统Flume与Sqoop
介绍如何使用flume和sqoop两个系统将外部流式数据(比如网站日志,用户行为数据等)、关系型数据库(比如MySQL、Oracle等)中的数据导入Hadoop中进行分析和挖掘
第11周 数据分析系统Hive与Pig应用与比较
介绍如何使用hive和pig分析hadoop中的海量数据
第12周 数据挖掘工具包Mahout
介绍如何使用mahout提供的数据挖掘和机器学习算法进行海量数据挖掘
第13周 工作流引擎Oozie与Azkaban应用
介绍如何使用Oozie和azkaban对MapReduce作业、Pig/hive作业等进行统一管理和调度
第14周 两个综合案例:日志分析系统与机器学习平台
介绍两个典型的互联网应用案例,进一步深入领悟hadoop生态系统中各个系统的应用场景和解决实际问题的方式。
2、《大数据前置课程系列--scala》
第一周 Scala基础
第二周 Scala面向对象编程
第三周 Scala函数式编程
第四周 Scala高级编程
3、《spark大数据平台基础》
第一周 Spark生态系统概述与编程模型
第二周 深入Spark内核
第三周 Spark Streaming原理与实践
第四周 Shark原理与实践
第五周 Machine Learning on Spark
第六周 Spark多语言编程
第七周 Spark SQL
第八周 图计算GraphX
第九周 Spark on Yarn
第十周 JobServer
4、《Hadoop进阶》
第一部分. MapReduce
Mapreduce工作流程及基本架构回顾
运维相关
开发相关
第二部分. hdfs
HDFS API
fuse(C API)
压缩
HDFS benchmark
Datanode添加及删除
多盘支持,磁盘错误感知
hdfs raid
HDFS block size设置相关问题
文件备份数设置
HDFS中合并文件
第三部分. Hadoop工具
dfsadmin/mradmin/balancer/distcp/fsck/fs/job
监控及报警
hadoop配置管理
第四部分. Hadoop调试
Log
本地模式调试map/reduce任务
远程调试
第五部分. 问题分析
Java GC介绍及java进程常用的分析工具jstat、jhat、jmap
top/iostat/netstat/lsof等
Jstack/kill -3
Strace
nload/tcpdump
第六部分.分析示例
MapReduce简单分析
用MapReduce实现Group-by
用MapReduce实现倒排索引
MapReduce实现直方图
MapReduce实现Join
5、《Hbase进阶》
6、《SQL on hadoop》
7、《Hadoop/Spark企业应用实战》
标签:style http io ar color os 使用 sp for
原文地址:http://www.cnblogs.com/hanying/p/4162891.html