前两天试了下 Flink SQL 写 Hive,对 Sink 部分写数据到 HDFS 的部分比较疑惑,特别是基于 checkpoint 的文件提交,所以看了下 StreamingFileSink 的源码(Flink SQL 写 hive 复用了这部分代码) StreamingFileSink 是 1 ...
分类:
其他好文 时间:
2020-11-01 20:49:03
阅读次数:
18
可能是Hadoop hdfs mapreduce最亲民的介绍
分类:
其他好文 时间:
2020-10-30 13:03:28
阅读次数:
17
配置 slaves [xiaoran@hadoop102 hadoop-2.7.2]$ vim etc/hadoop/slaves 添加(注意:一定不能有多余的空格和空行) hadoop102 hadoop103 hadoop104 同步所有节点配置文件 [xiaoran@hadoop102 had ...
分类:
其他好文 时间:
2020-10-29 10:44:54
阅读次数:
27
认知和学习Hadoop,我们必须得了解Hadoop的构成,我根据自己的经验通过Hadoop构件、大数据处理流程,Hadoop核心三个方面进行一下介绍: 一、 Hadoop组件 由图我们可以看到Hadoop组件由底层的Hadoop核心构件以及上层的Hadoop生态系统共同集成,而上层的生态系统都是基于 ...
分类:
其他好文 时间:
2020-10-29 10:11:31
阅读次数:
19
在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题,如果单个节点出现故障,可通过该方式将NameNode快速切换到另外一个节点上。
分类:
其他好文 时间:
2020-10-29 09:35:04
阅读次数:
15
配置集群 配置yarn-env.sh Linux系统中获取JDK的安装路径 [xiaoran@hadoop101 hadoop-2.7.2]$ echo $JAVA_HOME /opt/module/jdk1.8.0_144 修改JAVA_HOME路径 [xiaoran@hadoop101 hado ...
分类:
其他好文 时间:
2020-10-27 11:36:17
阅读次数:
28
Hadoop基础之环境搭建 环境搭建 本地环境 可以用于开发的单节点模式,没有分布式的概念 伪分布式环境 一个节点表示一整个集群,但是分布式的概念,一个节点充当分布式里的所有角色 完全分布式 一个集群中有N个节点,他们分别充当分布式中不同的角色,完成不同的任务 伪分布式环境搭建 下载安装包 Hado ...
分类:
其他好文 时间:
2020-10-26 11:17:07
阅读次数:
16
分治思想: 我有一万个元素,查找其中的一个元素,最简单的遍历方法 复杂度为O(4) (遍历四次),如何实现 准备2500个数组 查找x 补充知识:什么是hash & 什么是hashCode https://blog.csdn.net/weixin_38405253/article/details/9 ...
分类:
其他好文 时间:
2020-10-26 11:13:38
阅读次数:
17
1.本地文件系统创建一个文件,输入带姓名学号信息。 2.查看新建文件所在目录 3.查看新建文件内容 4.将此文件上传到HDFS文件系统上的用户目录 5.HDFS上查看相应目录 6.HDFS上查看文件内容 7.HDFS上查看文件大小 8.删除本地1步骤创建的文件 9.将HDFS上的文件下载到本地 10 ...
分类:
其他好文 时间:
2020-10-26 10:51:52
阅读次数:
18