发展: hive-cli(hive) 是hive连接hivesever的命令行工具,从hive出生就一直存在,但随着hive功能的增强、bug的修复、版本升级,hive-cli结构的局限性跟不上hive的发展,如果强行更改就不能满足向下兼容,就出现了全新的beeline命令行结构,即就是hive-c ...
分类:
其他好文 时间:
2021-06-19 19:08:02
阅读次数:
0
hive-site.xml添加以下参数: <property> <name>hive.cli.print.current.db</name> <value>true</value> </property> <property> <name>hive.cli.print.header</name> < ...
分类:
数据库 时间:
2021-06-19 19:07:44
阅读次数:
0
进入myql 执行 show variables like 'character%'; 看到如下: 乱码原因,databases编码格式不一致导致的乱码,解决方法如下: 方法一: 执行如下两个命令即可: set character_set_database=utf8; set character_s ...
分类:
其他好文 时间:
2021-06-19 19:06:39
阅读次数:
0
Hive列转行: select school,concat_ws('|',collect_set(name)) as name from tmp_01 group by school; 注意:collect_set 有重复的会去重, collect_list 有重复的不去重 hive行转列: sel ...
分类:
其他好文 时间:
2021-06-19 19:05:46
阅读次数:
0
1.下载Zookeeper 官网 使用wget下载: wget https://mirrors.bfsu.edu.cn/apache/zookeeper/zookeeper-3.7.0/apache-zookeeper-3.7.0-bin.tar.gz 2.解压资源 # 解压资源到指定目录下 tar ...
分类:
其他好文 时间:
2021-06-18 20:04:20
阅读次数:
0
一、数据预处理 1.1、在hdfs上新建目录 java程序启动前先在hdfs上建立相应文件夹,用于上传本地数据和处理后的数据 [root@hadoop102 ~]# hdfs dfs -mkdir -p /USAdatas/geodatas/inputs [root@hadoop102 ~]# hd ...
分类:
数据库 时间:
2021-06-18 19:17:01
阅读次数:
0
spark程序初始化HiveContext报错:空指针异常 版本说明: spark: 1.6.1 scala: 2.10.8 hive: 1.2.1 报错信息 java.lang.RuntimeException: java.lang.NullPointerException at org.apac ...
分类:
其他好文 时间:
2021-06-17 16:37:17
阅读次数:
0
在自己5年的开发生涯中时常在想crud对开发水平的提升真的有用吗?答案当然是没用的。通过自身的经历告诉大家唯有提高架构思想,完善问题解决方案才有提升的可能。在此就不再啰嗦了直接上干货。 场景描述:有这样一张关系型数据表包括身份证,姓名,年龄,手机号,家庭住址(数据量太大普通关系型数据库已无法支撑)。 ...
分类:
其他好文 时间:
2021-06-13 10:32:35
阅读次数:
0
1 需求描述 统计硅谷影音视频网站的常规指标,各种 TopN 指标: -- 统计视频观看数 Top10 -- 统计视频类别热度 Top10 -- 统计出视频观看数最高的 20 个视频的所属类别以及类别包含 Top20 视频的个数 -- 统计视频观看数 Top50 所关联视频的所属类别排序 -- 统计 ...
分类:
其他好文 时间:
2021-06-13 10:04:44
阅读次数:
0
4.1 统计视频观看数 Top10 思路:使用 order by 按照 views 字段做一个全局排序即可,同时我们设置只显示前 10 条。 最终代码: SELECT videoId, views FROM gulivideo_orc ORDER BY views DESC LIMIT 10; 4. ...
分类:
其他好文 时间:
2021-06-13 10:04:23
阅读次数:
0