标签:通过 数据 知识 c++ spark 大数据集 大数 个人网站 perl
1.数据存储:磁盘2.操作系统:Linux
3.
1.运维/大数据
大数据集群:
(1)分布式存储架构(HDFS)
(2)map-reduces的数据处理集群
注:
1)HDFS只是解决数据处理问题
2)map-reduces是将海量的数据按照一定的方式,修改为键值关系(key-value)
3)HDFS+map-reduces=Hadoop集群(运行于Linux上的一个高性能集群)
2.算法:
通过数学(统计学)+Python=算法。
3.数据可视化。
4.IT行业工作方向
(1)运维
1)Linux运维;包括web构架、搭建自己的个人网站方向
2)虚拟化KVM\XEN;包括openstack、docker(k$s)方向
3)Hadoop+java=大数据存储方向;包括spark学习(scala语言)、HDFS、map-reduces、Hive(SQL)、zookeeper
(2)开发---计算机语言
1)前端:JS、php、css、html、java
BASIC早期的机械语言
C语言 C++:系统开发、驱动开发、嵌入式开发(写板子)
(驱动程序:需要转换各个厂家设备之间的指令集,让厂家设备之前互通)
2)开发工具:脚本语言;shell、perl、python
3)数据库:MySQL、nosql
标签:通过 数据 知识 c++ spark 大数据集 大数 个人网站 perl
原文地址:https://blog.51cto.com/14475758/2424960