1. Hadoop 概览Google 三篇论文(GFS -> HDFS,Map-Reduce -> MR,BigTable -> HBase)是 Hadoop 的思想之源。Hadoop 生态非常庞大,其最初两大核心是 HDFS 和 MR,分别负责存储和计算(Hadoop 1.x 中,MR 既负责计算 ...
一.sqoop的简单概论 1.sqoop产生的原因: A. 多数使用hadoop技术的处理大数据业务的企业,有大量的数据存储在关系型数据中。 B. 由于没有工具支持,对hadoop和关系型数据库之间数据传输是一个很困难的事。 依据以上的原因sqoop产生的。 2. sqoop的介绍 sqoop是连接 ...
分类:
其他好文 时间:
2021-06-08 22:45:15
阅读次数:
0
docker安装kafka 1、下载zookeeper镜像 docker pull wurstmeister/zookeeper 2、下载kafka镜像 docker pull wurstmeister/kafka 3、查看镜像 docker images 4、单机方式先启动zookeeper容器 ...
分类:
系统相关 时间:
2021-06-08 22:39:02
阅读次数:
0
说起大数据,很多人都能聊上一会,但要是问大数据核心技术有哪些,估计很多人就说不上一二来了。 从机器学习到数据可视化,大数据发展至今已经拥有了一套相当成熟的技术树,不同的技术层面有着不同的技术架构,而且每年还会涌现出新的技术名词。面对如此庞杂的技术架构,很多第一次接触大数据的小白几乎都是望而生畏的。 ...
分类:
其他好文 时间:
2021-06-08 22:37:38
阅读次数:
0
运行环境 centos 5.6 hadoop hivesqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具 在使用过程中可能遇到的问题: sqoop依赖zookeeper,所以必须配置ZOOKEEPER_HOME到环境变量中。sq ...
分类:
数据库 时间:
2021-06-07 20:36:05
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 HDFS是Hadoop体系中数据存储管理的基础,它是一个高度容错的系统,能检测和应对硬件故障,在低成本的通用硬件上运行。 HBase构建在HDFS之上 ...
分类:
其他好文 时间:
2021-06-07 20:05:58
阅读次数:
0
HDFS客户端环境准备 1.根据拷贝编译后的hadoop jar包到非中文路径 2.配置HADOOP_HOME环境变量 3. 配置Path环境变量 4.创建一个Maven工程HdfsClientDemo 5.导入相应的依赖坐标+日志添加 <dependencies> <dependency> <gr ...
分类:
其他好文 时间:
2021-06-06 19:12:37
阅读次数:
0
zookeeper3.4.10 kafka 2.11 redis-4.0.2 ps -ef |grep redis 里面有一个 说明没事 mongodb 3.4.3 27017 他的表 叫collection scala 2.11.12 快捷键 1.如果包没有显示出来,需要自行添加, ctrl+al ...
分类:
其他好文 时间:
2021-06-05 18:14:39
阅读次数:
0
vip视频教程 IT自学视频教程 编程教程Flink+ClickHouse 玩转企业级实时大数据开发 vip视频教程 IT自学视频教程 编程教程Flink+ClickHouse 玩转企业级实时大数据开发(8章)已经在做大数据,Flink让你轻松提薪;尚未入行大数据,Flink让你弯道超车 Flink ...
分类:
其他好文 时间:
2021-06-03 17:40:23
阅读次数:
0