1.集群规划 在 hadoop102、hadoop103 和 hadoop104 三个节点上部署 Zookeeper。 2.解压安装 (1)解压 Zookeeper 安装包到/opt/module/目录下 [atguigu@hadoop102 software]$ tar -zxvf zookeep ...
分类:
其他好文 时间:
2020-07-21 01:06:25
阅读次数:
87
一、报错信息: Exception in thread "main" java.lang.RuntimeException: java.lang.InstantiationException at org.apache.hadoop.util.ReflectionUtils.newInstance( ...
分类:
编程语言 时间:
2020-07-20 15:47:15
阅读次数:
74
运行spark时提示如下信息: hadoop@MS-YFYCEFQFDMXS:/home/trp$ cd /usr/local/spark hadoop@MS-YFYCEFQFDMXS:/usr/local/spark$ ./bin/pyspark env: ‘python’: No such fi ...
分类:
编程语言 时间:
2020-07-19 23:47:58
阅读次数:
111
4 WritableComparable排序 1.排序的分类 2.自定义排序WritableComparable (1)原理分析 bean对象做为key传输,需要实现WritableComparable接口重写compareTo方法,就可以实现排序。 @Override public int com ...
分类:
其他好文 时间:
2020-07-19 23:23:07
阅读次数:
67
7 Combiner合并 (6)自定义Combiner实现步骤 (a)自定义一个Combiner继承Reducer,重写Reduce方法 public class WordcountCombiner extends Reducer<Text, IntWritable, Text,IntWritabl ...
分类:
其他好文 时间:
2020-07-19 23:19:55
阅读次数:
69
MapTask工作机制 MapTask工作机制如图4-12所示。 图4-12 MapTask工作机制 (1)Read阶段:MapTask通过用户编写的RecordReader,从输入InputSplit中解析出一个个key/value。 (2)Map阶段:该节点主要是将解析出的key/value交给 ...
分类:
其他好文 时间:
2020-07-19 23:10:43
阅读次数:
67
1.ReduceTask工作机制 ReduceTask工作机制,如图4-19所示。 图4-19 ReduceTask工作机制 (1)Copy阶段:ReduceTask从各个MapTask上远程拷贝一片数据,并针对某一片数据,如果其大小超过一定阈值,则写到磁盘上,否则直接放到内存中。 (2)Merge ...
分类:
其他好文 时间:
2020-07-19 23:09:27
阅读次数:
72
1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1。 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP 说明 hadoop01 10.0.0.10 DataNode、NodeManager、NameNode hadoop02 10.0.0 ...
分类:
其他好文 时间:
2020-07-19 16:31:06
阅读次数:
63
在企业开发中,Hadoop框架自带的InputFormat类型不能满足所有应用场景,需要自定义InputFormat来解决实际问题。 自定义InputFormat步骤如下: (1)自定义一个类继承FilelnputFormat。 (2)自定义一个类继承RecordReader,实现一次读取一个完整文 ...
分类:
其他好文 时间:
2020-07-19 16:25:43
阅读次数:
67
NameNode和Zookeeper的format
分类:
其他好文 时间:
2020-07-19 11:56:56
阅读次数:
99