搜索关键字：cdh hive 释放空间，搜索到6666个结果！码迷,mamicode.com！

pyspark dataframe save into hive

# 先定义dataframe各列的数据类型 from pyspark.sql.types import *schema = StructType([ StructField("a", NullType(), True), StructField("b", AtomicType(), True), S ...

分类：其他好文时间：2021-01-18 11:29:36 阅读次数：0

hive添加txt文件转oec表

1.数据格式 1 2 x2 2 x3 2 x4 2 x 2.创建表创建TEXTFILE格式的表 CREATE TABLE test_txt(id int,num int,txt string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES ...

分类：其他好文时间：2021-01-18 10:51:25 阅读次数：0

hive性能调优

1. 设置执行引擎 set hive.execution.engine=mr;set hive.execution.engine=spark; 如果设置执行引擎为MR，那么调用Hadoop的maprecude来运行需要执行的job的程序；如果设置执行引擎为spark，那么就会调用spark来执行任 ...

分类：其他好文时间：2021-01-15 12:15:21 阅读次数：0

hive只扫描一遍表实现查询不同条件的数据

工作中有一张类型信息表，有时候需要不同的类型信息需要多次扫描这张表，表很大的时候影响效率。优化前： select t1.fa_id,t2.srch_char_val,t3.srch_char_val from (select fa_id from cisadm_ods.ods_cis_ci_fa_ ...

分类：其他好文时间：2021-01-13 10:40:03 阅读次数：0

卸载Ambari

* 如果是非Ubuntu系统，下面的apt-get命令要换成yum命令。apt-cache search all | grep -> yum list installed | grepapt-get purge -y -> yum remove -y其中的参数-y是过程中所有提示都自动选yes的作用 ...

分类：其他好文时间：2021-01-07 12:30:42 阅读次数：0

大数据组件

Atlas 作用：记录并展示Hive表字段含义，以及表和字段之间的数据血缘关系。局限：依赖HBase和solr。 Azkaban 作用：实现任务流执行，满足任务间依赖关系。局限：任务能添加依赖的任务，但是不能传参数，任务流中任意一条路线断了，不能这条路线重启执行。 ...

分类：其他好文时间：2021-01-07 12:23:38 阅读次数：0

Impala和Hive的关系

1.为什么安装Impala一定要先安装Hive？ Impala是基于Hive的大数据实时分析查询引擎，直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。 2.Impala与Hive的关系？ Impala 与Hive都是构建在Hadoop之上的 ...

分类：其他好文时间：2021-01-06 11:58:32 阅读次数：0

Hive基础(二十二)：面试题:Hive调优全方位指南(一)

来源:https://mp.weixin.qq.com/s/NdvHxOtVB7AS5P75QdVO7Q 正文目录 1、表层面 1.1 利用分区表优化 1.2 利用分桶表优化 1.3 选择合适的文件存储格式 1.4 选择合适的压缩格式 2、HQL层面优化 2.1 执行计划 2.1 列、行、分区裁剪 ...

分类：其他好文时间：2021-01-05 11:16:21 阅读次数：0

网站用户行为分析

网站用户行为分析步骤 1.1 本地数据集上传到数据仓库Hive 数据集下载与查看数据集预处理把数据集导入HDFS中在Hive上创建数据库 1.2 Hive数据分析给出数据分析需求用select语句实现数据分析数据分析结果查看与保存 1.3 Hive、MySQL、HBase数据互导操作 ...

分类：Web程序时间：2021-01-02 11:41:47 阅读次数：0

Zookeeper - 1 概述&命令

Zookeeper 概述&命令 1)初识 Zookeeper 1.1)Zookeeper概念 ?Zookeeper 是 Apache Hadoop 项目下的一个子项目，是一个树形目录服务。 ?Zookeeper 翻译过来就是动物园管理员，他是用来管 Hadoop（大象）、Hive(蜜蜂)、Pig( ...

分类：其他好文时间：2021-01-02 11:29:32 阅读次数：0

共6666条上一页 1 ... 9 10 11 12 13 ... 667 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)