准备:1. 规划3个集群节点:hosts主机都已经配置好映射,映射主机名分别为master,slave1,slave2,且已经进行ssh免密配置,确保端口互通,防火墙关闭 2. 先安装好scala(参考:https://www.cnblogs.com/sea520/p/13518158.html) ...
分类:
其他好文 时间:
2021-06-19 19:11:31
阅读次数:
0
发展: hive-cli(hive) 是hive连接hivesever的命令行工具,从hive出生就一直存在,但随着hive功能的增强、bug的修复、版本升级,hive-cli结构的局限性跟不上hive的发展,如果强行更改就不能满足向下兼容,就出现了全新的beeline命令行结构,即就是hive-c ...
分类:
其他好文 时间:
2021-06-19 19:08:02
阅读次数:
0
hive-site.xml添加以下参数: <property> <name>hive.cli.print.current.db</name> <value>true</value> </property> <property> <name>hive.cli.print.header</name> < ...
分类:
数据库 时间:
2021-06-19 19:07:44
阅读次数:
0
进入myql 执行 show variables like 'character%'; 看到如下: 乱码原因,databases编码格式不一致导致的乱码,解决方法如下: 方法一: 执行如下两个命令即可: set character_set_database=utf8; set character_s ...
分类:
其他好文 时间:
2021-06-19 19:06:39
阅读次数:
0
Hive列转行: select school,concat_ws('|',collect_set(name)) as name from tmp_01 group by school; 注意:collect_set 有重复的会去重, collect_list 有重复的不去重 hive行转列: sel ...
分类:
其他好文 时间:
2021-06-19 19:05:46
阅读次数:
0
转自:https://blog.csdn.net/qq_25062299/article/details/95592877 ...
分类:
其他好文 时间:
2021-06-19 19:00:51
阅读次数:
0
HDFS的读取过程 HDFS的读取流程大致有以下几个步骤: (1)客户端通过调用FileSystem对象的open()来打开希望读取的文件。对于HDFS平台来说,这个对象是DistributedFileSystem类的是一个实例,所以实际调用的是DistributedFileSystem对象的ope ...
分类:
其他好文 时间:
2021-06-19 18:42:26
阅读次数:
0
简介: 最佳实践,以DLA为例子。DLA致力于帮助客户构建低成本、简单易用、弹性的数据平台,比传统Hadoop至少节约50%的成本。其中DLA Meta支持云上15+种数据数据源(OSS、HDFS、DB、DW)的统一视图,引入多租户、元数据发现,追求边际成本为0,免费提供使用。DLA Lakehou ...
分类:
其他好文 时间:
2021-06-18 20:06:29
阅读次数:
0
将数据从HDFS把文件导出到RDBMS数据库 导出前,目标表必须存在于目标数据库中。 默认操作是从将文件中的数据使用INSERT语句插入到表中 更新模式下,是生成UPDATE语句更新表数据 数据是在HDFS当中的如下目录/sqoop/emp,数据内容如下 1201,gopal,manager,500 ...
分类:
其他好文 时间:
2021-06-18 19:31:03
阅读次数:
0
一、数据预处理 1.1、在hdfs上新建目录 java程序启动前先在hdfs上建立相应文件夹,用于上传本地数据和处理后的数据 [root@hadoop102 ~]# hdfs dfs -mkdir -p /USAdatas/geodatas/inputs [root@hadoop102 ~]# hd ...
分类:
数据库 时间:
2021-06-18 19:17:01
阅读次数:
0