码迷,mamicode.com
首页 >  
搜索关键字:spark sql hive    ( 91425个结果
hiveserver2的配置和启动
概览1.配置hive-site.xml2.配置hadoop中的core-site.xml文件3.测试 首先将hive安装 然后更改部分配置文件 1.配置hive-site.xml利用Xshell工具连接虚拟机 进入hive安装目录下的conf文件夹,更改hive-site.xml配置文件其中配置参考 ...
分类:其他好文   时间:2021-06-19 19:20:19    阅读次数:0
spark安装配置
准备:1. 规划3个集群节点:hosts主机都已经配置好映射,映射主机名分别为master,slave1,slave2,且已经进行ssh免密配置,确保端口互通,防火墙关闭 2. 先安装好scala(参考:https://www.cnblogs.com/sea520/p/13518158.html) ...
分类:其他好文   时间:2021-06-19 19:11:31    阅读次数:0
Hive-cli(hive)与Beeline的区别
发展: hive-cli(hive) 是hive连接hivesever的命令行工具,从hive出生就一直存在,但随着hive功能的增强、bug的修复、版本升级,hive-cli结构的局限性跟不上hive的发展,如果强行更改就不能满足向下兼容,就出现了全新的beeline命令行结构,即就是hive-c ...
分类:其他好文   时间:2021-06-19 19:08:02    阅读次数:0
Hive默认显示数据库和表名配置
hive-site.xml添加以下参数: <property> <name>hive.cli.print.current.db</name> <value>true</value> </property> <property> <name>hive.cli.print.header</name> < ...
分类:数据库   时间:2021-06-19 19:07:44    阅读次数:0
sqoop将hive数据导出到myql乱码问题解决
进入myql 执行 show variables like 'character%'; 看到如下: 乱码原因,databases编码格式不一致导致的乱码,解决方法如下: 方法一: 执行如下两个命令即可: set character_set_database=utf8; set character_s ...
分类:其他好文   时间:2021-06-19 19:06:39    阅读次数:0
Hive不常用操作记录
Hive列转行: select school,concat_ws('|',collect_set(name)) as name from tmp_01 group by school; 注意:collect_set 有重复的会去重, collect_list 有重复的不去重 hive行转列: sel ...
分类:其他好文   时间:2021-06-19 19:05:46    阅读次数:0
mysql8更改大小写敏感(现网环境)
恢复内容开始 1、备份数据 操作服务器:主数据库 #备份mysql中所有数据库数据./mysqldump -h主数据库ip -uroot -p -P3308 --all-databases > /data0/all_db.sql 2、停库 操作服务器:主备数据库均操作 systemctl stop ...
分类:数据库   时间:2021-06-18 20:00:25    阅读次数:0
数据倾斜的原因是什么,如何解决
key 分布不均匀 业务数据本身的欠缺性 建表设计方法不对 有些 SQL 难免会有一下数据倾斜不可避免 表现的形式: 任务完成进度卡死在99%,或者进度完成度在100%但是查看任务监控,发现还是有少量(1个或几个)reduce 子任务未完成。因为其处理的数据量和其他 reduce 差异过大。单一re ...
分类:其他好文   时间:2021-06-18 19:56:57    阅读次数:0
MySQL 百万级数据分页查询优化
方法1: 直接使用数据库提供的SQL语句 语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N 适应场景: 适用于数据量较少的情况(元组百/千级) 原因/缺点: 全表扫描,速度会很慢 且 有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2, ...
分类:数据库   时间:2021-06-18 19:51:23    阅读次数:0
数据预处理与转存(Hive--Mysql)
一、数据预处理 1.1、在hdfs上新建目录 java程序启动前先在hdfs上建立相应文件夹,用于上传本地数据和处理后的数据 [root@hadoop102 ~]# hdfs dfs -mkdir -p /USAdatas/geodatas/inputs [root@hadoop102 ~]# hd ...
分类:数据库   时间:2021-06-18 19:17:01    阅读次数:0
91425条   上一页 1 ... 12 13 14 15 16 ... 9143 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!