搜索关键字：hive 集群搭建，搜索到7132个结果！码迷,mamicode.com！

数据预处理与转存（Hive--Mysql）

一、数据预处理 1.1、在hdfs上新建目录 java程序启动前先在hdfs上建立相应文件夹，用于上传本地数据和处理后的数据 [root@hadoop102 ~]# hdfs dfs -mkdir -p /USAdatas/geodatas/inputs [root@hadoop102 ~]# hd ...

分类：数据库时间：2021-06-18 19:17:01 阅读次数：0

Spark初始换HiveContext空指针异常

spark程序初始化HiveContext报错：空指针异常版本说明： spark: 1.6.1 scala: 2.10.8 hive: 1.2.1 报错信息 java.lang.RuntimeException: java.lang.NullPointerException at org.apac ...

分类：其他好文时间：2021-06-17 16:37:17 阅读次数：0

集群搭建（脑裂）

# 1 广播方式（一般不用） -只要es节点能联通，ping，自动加人到节点中 # 2 单播方式 #1 elasticsearch1节点，,集群名称是my_es1,集群端口是9300；节点名称是node1，监听本地9200端口，可以有权限成为主节点和读写磁盘（不写就是默认的）。 cluster.na ...

分类：其他好文时间：2021-06-16 17:35:51 阅读次数：0

Hive基础(四十)：Hive 实战（一）准备

1 需求描述统计硅谷影音视频网站的常规指标，各种 TopN 指标： -- 统计视频观看数 Top10 -- 统计视频类别热度 Top10 -- 统计出视频观看数最高的 20 个视频的所属类别以及类别包含 Top20 视频的个数 -- 统计视频观看数 Top50 所关联视频的所属类别排序 -- 统计 ...

分类：其他好文时间：2021-06-13 10:04:44 阅读次数：0

Hive基础(四十一)：Hive 实战（二）业务分析

4.1 统计视频观看数 Top10 思路：使用 order by 按照 views 字段做一个全局排序即可，同时我们设置只显示前 10 条。最终代码： SELECT videoId, views FROM gulivideo_orc ORDER BY views DESC LIMIT 10; 4. ...

分类：其他好文时间：2021-06-13 10:04:23 阅读次数：0

Hive基础(三十八)：Hive DML (二) JOIN/排序

4 Join 语句 4.1 等值 Join Hive 支持通常的 SQL JOIN 语句，但是只支持等值连接，不支持非等值连接。案例实操（1）根据员工表和部门表中的部门编号相等，查询员工编号、员工名称和部门名称； hive (default)> select e.empno, e.ename, ...

分类：编程语言时间：2021-06-13 10:00:11 阅读次数：0

Hive基础(三十九)：Hive DML (三) 分桶及抽样查询/其他常用查询函数

6 分桶及抽样查询 6.1 分桶表数据存储分区提供一个隔离数据和优化查询的便利方式。不过，并非所有的数据集都可形成合理的分区。对于一张表或者分区，Hive 可以进一步组织成桶，也就是更为细粒度的数据范围划分。分桶是将数据集分解成更容易管理的若干部分的另一个技术。分区针对的是数据的存储路径；分桶针 ...

分类：其他好文时间：2021-06-13 09:57:59 阅读次数：0

hive cli转hive beeline的几个例子

#COMMAND="hive -i settings/load-${SCHEMA_TYPE}.sql -f ddl-tpch/bin_${SCHEMA_TYPE}/${t}.sql \ # -d DB=${DATABASE} \ # -d SOURCE=tpch_text_${SCALE} -d B ...

分类：其他好文时间：2021-06-10 18:25:11 阅读次数：0

[数据仓库]分层概念,ODS,DM,DWD,DWS,DIM的概念

转自：https://blog.csdn.net/pmdream/article/details/113601956 一. 各种名词解释 1.1 ODS是什么？ ODS层最好理解，基本上就是数据从源表拉过来，进行etl，比如mysql 映射到hive，那么到了hive里面就是ods层。 ODS 全称 ...

分类：其他好文时间：2021-06-10 17:32:45 阅读次数：0

Windows10 从零搭建 Hadoop/Hive 环境及 Hive 入门

1. Hadoop 概览Google 三篇论文（GFS -> HDFS，Map-Reduce -> MR，BigTable -> HBase）是 Hadoop 的思想之源。Hadoop 生态非常庞大，其最初两大核心是 HDFS 和 MR，分别负责存储和计算（Hadoop 1.x 中，MR 既负责计算 ...

分类：Windows程序时间：2021-06-08 23:15:13 阅读次数：0

共7132条上一页 1 2 3 4 5 ... 714 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)