HIVE入门操作

时间：2014-05-18 18:44:37 阅读：311 评论：0 收藏：0 [点我收藏+]

标签：dfs hive

1 HIVE入门操作

1.1 连接环境

输入 hive;进入hive环境

输入 quit;退出hive环境

1.2 查看数据库

show databases;

1.3 创建数据库

create database mng;

1.4 链接数据库

use mng;

成功显示如下：

1.5 查看表

show tables;

1.6 创建表注意点

l 数据类型对比

NUMBER(14) -- BIGINT

NUMBER(m,n) – DOUBLE

VARCHAR2 -- STRING

NUMBER(1) -- TINYINT

~~l 表只保留一级分区；使用数据时间做分区~~

l 表分区保留多级分区

l 去掉default和not null声明

l 分区字段的数据不需要写入表文件

l insert数据时，hive默认用\N表示null值，需要改变这个设置，使用‘‘表示null值

alter table tablename set serdeproperties(‘serialization.null.format‘ = ‘‘);

l 表存储设置有两种定义方式，推荐用方式2

表定义1：

create table TEST

(

cell_id string,

user_cnt bigint,

hcsv_cnt bigint,

arpu double,

call_dur_sum double,

sms_cnt_sum bigint,

data_vol_sum double,

erl double

)

partitioned by (data_date bigint)

row format delimited

fields terminated by ‘|‘

collection items terminated by ‘,‘

map keys terminated by ‘-‘

lines terminated by ‘\n‘;

alter table mng_av_in_m set serdeproperties(‘serialization.null.format‘ = ‘‘);

表定义2：

create table TEST

(

cell_id string,

user_cnt bigint,

hcsv_cnt bigint,

arpu double,

call_dur_sum double,

sms_cnt_sum bigint,

data_vol_sum double,

erl double

)

row format serde ‘org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe‘ with serdeproperties

(

‘escape.delim‘=‘//‘,

‘mapkey.delim‘=‘-‘,

‘serialization.format‘=‘|‘,

‘colelction.delim‘=‘,‘,

‘field.delim‘=‘|‘,

‘line.delim‘=‘\n‘,

‘serialization.null.format‘=‘‘

)

stored as textfile;

1.7 测试数据导入表命令

load data local inpath ‘文件路径‘ overwrite into table TABLE_NAME partition (DATA_DATE=‘20130101000000‘);

备注：分区字段的数据不需要写入表文件

1.8 查看表对应的目录和文件

desc formatted tablename;

1.9 查看表对应的数据文件

dfs -ls 文件路径

1.10 查看表文件中的数据

dfs –cat 文件路径

1.11 truncate 分区

truncate table TABLE_NAME partition (sum_start_dttm=20131001000000);

1.12 删除分区

ALTER TABLE TABLE_NAME DROP PARTITION (sum_start_dttm = 20131001000000);

HIVE入门操作,布布扣,bubuko.com

HIVE入门操作

标签：dfs hive

原文地址：http://blog.csdn.net/mygrowth/article/details/26082801

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行