1. 列举出所有的数据库 命令行查看帮助 sqoop help 列出hadoop02主机所有的数据库 sqoop list-databases --connect jdbc:mysql://hadoop02:3306/ --username root --password 123456 查看某一个数 ...
分类:
其他好文 时间:
2021-06-18 19:33:43
阅读次数:
0
https://blog.csdn.net/linuxvfast/article/details/93720931 在Hadoop安装目录下找到sbin文件夹 在里面修改四个文件 对于start-dfs.sh和stop-dfs.sh文件,添加下列参数: #!/usr/bin/env bash HDF ...
分类:
其他好文 时间:
2021-05-24 06:40:05
阅读次数:
0
杀死进程 $HADOOP_HOME/sbin/stop-yarn.sh $HADOOP_HOME/sbin/stop-dfs.sh 删除所有节点 hadoop 根目录下的 data 和 logs rm -rf data/ logs/ 格式化 在 hadoop 根目录下执行 hdfs namenode ...
分类:
其他好文 时间:
2021-03-06 14:35:10
阅读次数:
0
每个task处理一个partition,一个文件的大小/128M就是task的数量 Task的最大并发数 当task被提交到executor之后,会根据executor可用的cpu核数,决定一个executor中最多同时运行多少个task。 默认情况下一个task对应cpu的一个核。如果一个exec ...
分类:
其他好文 时间:
2021-02-02 11:14:58
阅读次数:
0
hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。 UDF 创建与使用步骤 继承org.apache.hadoop.hiv ...
分类:
其他好文 时间:
2020-12-25 13:07:42
阅读次数:
0
大数据查询引擎Presto简介SQLonHadoop:Hive的出现让技术人员可以通过类SQL的方式对批量数据进行查询,而不用开发MapReduce程序MapReduce计算过程中大量的中间结果磁盘落地使运行效率较低为了提高SQLonHadoop的效率,各大工具应运而生,比如Shark、Impala等SQLonHadoop的常见工具:Presto是什么:Presto是由Facebook开发的分布式
分类:
数据库 时间:
2020-11-21 12:01:11
阅读次数:
8
上级:https://www.cnblogs.com/hackerxiaoyon/p/12747387.html 每个函数和算子都可以有状态在flink中。状态的函数存储数据通过独立的元素或事件处理。为了让状态具有容错性,flink需要把状态进行快照。检查点允许flink恢复状态和位置在流中,从而是 ...
分类:
其他好文 时间:
2020-10-29 09:52:49
阅读次数:
16
这是一份涵盖了Java相关29个技能的Java架构进阶学习资料,绝对是全网最好全完整的一个学习文档资料了。下面给大家介绍一下这份【BAT面试手册】都有哪些知识点的详细解析。 需要领取完整版的老铁请转发+关注,然后添加我的VX(tkzl6666)获得免费领取方式! 1、JVM 线程 JVM内存区域 J ...
分类:
编程语言 时间:
2020-10-16 10:27:24
阅读次数:
24
1.flume简介 Flume是Cloudera提供的日志收集系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 2.安装和使用说明 ...
分类:
Web程序 时间:
2020-08-13 22:07:34
阅读次数:
83
Yarn资源调度器 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。 Yarn基本架构 YARN主要由ResourceManager、NodeManager、ApplicationMas ...
分类:
其他好文 时间:
2020-07-26 23:11:08
阅读次数:
88