码迷,mamicode.com
首页 > 其他好文 > 详细

北京上海Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(程序员)

时间:2016-09-18 21:24:14      阅读:121      评论:0      收藏:0      [点我收藏+]

标签:cloudera   管理员   程序员   北京   上海   hadoop   

北京上海Cloudera Hadoop大数据培训:CCAH(管理员)CCA(Spark and Hadoop)

北京9月27-30日Cloudera  Administrator Training for Apache Hadoop(CCAH) 

上海9月27-30日Cloudera  Administrator Training for Apache Hadoop(CCAH)   

北京10月17-20日Cloudera Data Analyst Training

上海10月27-30日Cloudera Developer training for Spark and Hadoop(CCA-175) 

 

【其他课程安排请咨询】400-679-6113

Cloudera大数据 478790619

 

课程内容:

Cloudera Apache Hadoop管理员课程】

    课时:4

    学习系统管理的概念和Apache Hadoop的最佳实践,

    从安装和配置到负载均衡和调优。

    这个4天的的课程通过动手时间来赋予你部署的经验,

    以及更多的安全方面的经验和故障排除。

    课程结束后,学员被鼓励去参加ClouderaApache Hadoop管理员(CCAH)考试。

 

    【课程内容】

    1Hadoop分布式文件系统(HDFS

    2YARN/MapReduce的工作原理

    3、如何优化Hadoop机群所需要的硬件配置

    4、搭建Hadoop机群所需要考虑的网络因素

    5Hadoop机群维护和控制

    6、如何利用Hadoop配置选项进行系统性能调优

    7、如何利用FairScheduler为多用户提供服务级别保障

    8Hadoop机群维护和监控

    9、如何使用Flume从动态生成的文件加载到Hadoop

    10、如何使用Sqoop从关系型数据加载数据

    11Hadoop生态系统工具(如HiveImpalaPigBase

 

    【学员基础】

    具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

 

    【授课形式】

案例教学+上机实践

 

 

Cloudera Apache Hadoop开发者课程】

  课时:4

  【课程内容】

    什么是Spark

    回顾:从Hadoop MapReduceSpark

    回顾:HDFS

    回顾:YARN

    spark概述

 

    spark Shell的使用

    RDDS(弹性分布式数据集)

    Spark中的函数式编程

 

    创建RDDs

    其它通用RDD操作

 

    键值对RDDPair RDDs

    Map-Reduce

    其它键值对RDD(Pair RDDS)操作

 

    Spark应用程序vs. Spark Shell

    创建SparkContext

    建立Spark应用程序(Scalajava)

    运行Spark应用程序

 

    Spark应用程序网页用户界面(Web UI)

    配置Spark属性

    日志记录

 

    回顾:集群上的Spark

    RDD分区

    基于文件RDDs的分区

    HDFS和数据本地性

    执行并行操作

    阶段和任务

 

    RDD沿袭

    RDD持久化概述

    分布式持久化

 

    Spark Streaming概述

    实例:流请求计数

    DStreams

    开发Spark Streaming应用程序

 

    多批处理操作

    状态操作

    滑动窗口操作

    高级数据源

 

    通用的Spark使用案例

    Spark中的迭代算法

    图处理与分析

    机器学习

    实例:K-means

 

    共享变量:广播变量(Broadcast Variables

    共享变量:累加器(Accumulators

    常见性能问题

    诊断性能问题

 

    SparkSQLSQL Context

    创建DataFrames

    DataFrames转化和查询

    保存DataFrames

    DataFramesRDDS

SparkSQL,ImpalaHive-on-Spark的比较

 

   【学员基础】

    具备项目经验熟悉PythonScala;熟悉MySQL会有帮助

 

    【授课形式】

案例教学+上机实践

 

 


北京上海Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(程序员)

标签:cloudera   管理员   程序员   北京   上海   hadoop   

原文地址:http://11931070.blog.51cto.com/11921070/1853728

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!