大数据是对海量数据存储、计算、统计、分析等一系列处理手段,处理的数据量是TB级,甚至是PB或EB级的数据,是传统数据处理手段无法完成的,大数据涉及分布式计算、高并发处理、高可用处理、集群、实时性计算等等,汇集的是IT最热门、最流行的IT技术,大数据是机器学习、深度学习、AI等尖端可以领域的基础架构。
大数据技术为决策提供依据,在政府、企业、科研项目等决策中扮演着重要的角色,在社会治理和企业管理中起到了不容忽视的作用,例如我国、美国以及欧盟等国家都已将大数据列入国家发展战略,微软、谷歌、百度以及亚马逊等大型企业也将大数据技术列为未来发展的关键筹码。
那么,常用的大数据技术有哪些呢?
第一阶段JavaSE + MySql + Linux
Java 基础 → OOP编程 →Java集合 → IO/NIO → Eclipse → Intellij IDEA → Socket网络技术 → Mysql 数据库 → JDBC Api → JVM内存结构 → 阶段项目实战 → Linux(VMware、CentOS、目录结构、Linux命令)
第二阶段Hadoop 与 生态系统
Hadoop→ MapReduce → Hive → Avro与Protobuf → Zookeeper → HBase → phoenix → Redis → Flume分布式 → SSM(Spring、SpringMVC、Mybatis) → Kafka架构
第三阶段Storm 与Spark 及其生态圈
Scala → Spark Job → Spark RDD → spark job部署与资源分配 → Spark shuffle → Spark SQL → Spark Streaming → Spark ML → azkaban
第四阶段其他
Python与数据分析
第五阶段项目实战、技术综合运用
大数据商业实战阶段需掌握的技术有:实操企业大数据处理业务场景,分析需求、解决方案实施,综合技术实战应用。
在拥有Java编程语言基础的前提下,可以学习以上大数据技术,大数据是未来的发展方向,正在挑战我们的分析能力及对世界的认知方式,因此,我们与时俱进,迎接变化,并不断的成长,掌握大数据核心技术,才是掌握真正的价值所在。
原文地址:http://blog.51cto.com/13543490/2094325