2015年近期公开课安排:(全国巡回开班)
08月21日——08月23日大连
09月23日——09月25日北京
10月16日——10月18日成都
11月27日——11月29日深圳
12月24日——12月26日广州
01月27日——01月29日杭州
招生对象:
大数据Hadoop与Spark技术的应用开发工程师
大数据分析与挖掘工程师
大数据集群运维工程师
大数据项目的IT管理人员
大数据项目规划的咨询人员
对Hadoop与Spark大数据技术感兴趣的爱好者
打算上线大数据项目及具有大数据应用需求的各行业的企业信息化技术与管理人员
具备一定的Java和Linux基础的尤佳。
培训证书:中国信息化培训中心颁发的《大数据Hadoop开发高级架构师》证书。
收费标准:5800元/人
公开课培训大纲:(内训方案可定制)
日程 |
培训模块 |
培训要点 |
第一天 上午 |
一、大数据技术基础入门 |
1.大数据的产生背景、发展历程 2.大数据和云计算的关系 3.大数据应用需求以及潜在价值分析 4.业界最新的大数据技术发展态势与应用趋势 5.大数据项目的技术选型与架构设计 6.“互联网+”时代下的电子商务、制造业、零售批发业、电信运营商、互联网金融业、网上银行、电子政务、移动互联网、教育信息化等行业应用实践与应用案例剖析 |
二、业界主流的大数据技术产品与项目解决方案 |
7.国内外主流的大数据解决方案介绍 8.当前大数据解决方案与传统数据库方案的剖析比较 9.Apache大数据平台方案剖析 10.CDH大数据平台方案剖析 11.HDP大数据平台方案剖析 12.开源的大数据生态系统平台剖析 |
|
三、Hadoop与Spark大数据处理平台 |
13.Hadoop的发展历程以及产业界的实际应用介绍 14.Hadoop大数据平台架构,以及PB级大数据处理工作原理与机制 15.Hadoop的核心组件剖析 16.Spark的发展历程以及业界的实际应用介绍 17.Spark实时大数据处理平台架构,以及内存大数据处理工作原理与机制 18.Spark的核心组件剖析 |
|
第一天 下午 |
四、大数据采集与分布式消息订阅系统 |
19.Flume-NG数据采集系统的数据流模型、平台架构、集群部署与配置应用实战 20.Kafka分布式消息订阅系统的应用介绍、平台架构、集群部署与配置应用实战 21.Scribe分布式日志收集系统的简介、工作原理、平台架构、集群部署与配置应用实战 22.ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署与配置应用实战 |
五、大数据分布式存储系统 |
23.分布式文件系统HDFS的简介 24.HDFS系统的主从式平台架构和工作原理 25.HDFS核心技术讲解 26.HDFS应用开发实战 27.HDFS集群的安装、部署、配置与性能优化技巧 28.分布式键值存储系统介绍、平台架构、核心技术以及应用开发 29.PB及大数据存储系统的项目案例分析 |
|
六、大数据MapReduce与Yarn并行处理平台 |
30.MapReduce并行计算模型 31.MapReduce作业执行与调度技术 32.第二代大数据计算框架Yarn的工作原理以及DAG并行执行机制 33.MapReduce应用开发环境的部署,以及大数据并行处理应用程序开发 34.MapReduce高级编程技巧与性能优化实践 35.MapReduce与Yarn项目案例实践 |
|
第二天 上午 |
七、大数据Spark实时处理平台 |
36.内存计算模型和实时处理技术介绍 37.Spark分布式实时处理框架及工作原理 38.Spark集群的平台架构及其生态系统组件剖析 39.Spark SQL应用实践 40.Spark Streaming应用实践 41.MLib/MLBase实时机器学习应用实践 42.GraphX实时图数据处理应用实践 43.Spark实时处理集群的安装部署与配置优化 44.Spark的编程开发应用实战 45.Spark与Hadoop的对接集成解决方案实践 |
八、Storm流式数据处理平台 |
46.Storm流式处理系统介绍、平台架构以及工作原理 47.Storm集群安装部署与配置优化 48.Storm日志分析项目应用实战 |
|
第二天 下午 |
九、HBase分布式数据库管理系统 |
49.NoSQL数据库与NewSQL数据库技术介绍,及其在半结构化和非结构化大数据方面的应用实践 50.HBase分布式数据库简介、数据模型以及工作原理 51.HBase分布式数据库集群的平台架构和关键技术剖析 52.HBase应用项目开发技巧,以及客户端开发实战 53.HBase表设计与数据操作以及数据库管理API调用 54.HBase集群的安装部署与配置优化 55.HBase集群的运维与监控管理 |
十、Cassandra数据管理系统 |
56.Cassandra数据存储管理系统的应用介绍 57.Cassandra集群的平台架构以及核心关键技术 58.Cassandra一致性哈希算法与数据对象分布策略 59.Cassandra集群的安装部署与配置优化 60.Cassandra应用开发实战 |
|
第三天 上午 |
十一、内存数据库管理系统集群 |
61.Impala实时查询系统的应用介绍 62.Impala实时查询系统平台架构、核心关键技术剖析 63.Impala实时查询系统的部署与应用开发实践 64.Redis内存数据库介绍,以及业界应用案例 65.Redis内存数据库集群架构以及核心技术剖析 66.Redis集群的安装部署与应用开发实战 |
十二、大型数据仓库Hive集群平台 |
67.基于Hadoop的大型分布式数据仓库基础知识,以及在行业中的应用实践案例 68.基于Spark的实时数据仓库集群基础知识,以及在行业中的应用实践案例 69.Hive大数据仓库简介以及应用介绍 70.Hive数据仓库集群的平台体系结构、核心技术剖析 71.Hive Server工作原理与应用技巧 72.Hive数据仓库集群的安装部署与配置优化 73.Hive应用开发技巧 74.Hive QL定义以及应用 75.Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧 76.Hive数据仓库报表设计、HWI、CLI客户端演示以及用户自定义函数(UDF)的开发实践 |
|
第三天 下午 |
十三、Mahout大数据分析挖掘平台 |
77.大数据分析挖掘技术介绍,以及行业大数据挖掘应用案例 78.Mahout大数据挖掘平台的体系架构、核心算法与关键技术运用 79.基于Mahout的数据挖掘应用程序开发实战 80.Mahout集群的安装部署与配置优化 81.集成Mahout与Hadoop集成大数据挖掘平台应用实战 |
十四、大数据智能化ETL操作以及Hadoop集群运维监控工具平台应用 |
82.Hadoop与DBMS之间进行数据转换的框架 83.Sqoop导入导出数据的工作原理,以及Sqoop集群安装部署与配置 84.Kettle集群的平台架构、核心技术工作原理以及应用案例 85.Kettle集群安装部署与配置,以及应用开发实战 86.利用Sqoop实现MySQL与Hadoop集群之间的数据导入导出交互程序 87.Hadoop大数据运维监控系统HUE平台的安装部署与配置优化 |
|
十五、大数据项目应用实战 |
88.根据布置的实际应用案例,开展大数据完整项目部署设计和应用开发实践
|