码迷,mamicode.com
首页 > 其他好文 > 详细

HIVE入门操作

时间:2014-05-18 18:44:37      阅读:311      评论:0      收藏:0      [点我收藏+]

标签:dfs   hive   

1      HIVE入门操作

1.1      连接环境

输入 hive;进入hive环境

输入 quit;退出hive环境

 

1.2      查看数据库

show databases;

 

1.3      创建数据库

create database mng;

 

1.4      链接数据库

use mng;

成功显示如下:

 

1.5      查看表

show tables;

 

1.6      创建表注意点

l  数据类型对比

NUMBER(14) -- BIGINT

NUMBER(m,n) – DOUBLE

VARCHAR2 -- STRING

NUMBER(1) -- TINYINT

 

l  表只保留一级分区;使用数据时间做分区

l  表分区保留多级分区

l  去掉defaultnot null声明

l  分区字段的数据不需要写入表文件

l  insert数据时,hive默认用\N表示null值,需要改变这个设置,使用‘‘表示null

alter table tablename set serdeproperties(‘serialization.null.format‘ = ‘‘);

l  表存储设置有两种定义方式,推荐用方式2

表定义1

create table TEST

(

  cell_id      string,

  user_cnt     bigint,

  hcsv_cnt     bigint,

  arpu         double,

  call_dur_sum double,

  sms_cnt_sum  bigint,

  data_vol_sum double,

  erl          double

)

partitioned by (data_date bigint)

row format delimited

fields terminated by ‘|‘

collection items terminated by ‘,‘

map keys terminated by ‘-‘

lines terminated by ‘\n‘;

alter table mng_av_in_m set serdeproperties(‘serialization.null.format‘ = ‘‘);

 

表定义2

create table TEST

(

  cell_id      string,

  user_cnt     bigint,

  hcsv_cnt     bigint,

  arpu         double,

  call_dur_sum double,

  sms_cnt_sum  bigint,

  data_vol_sum double,

  erl          double

)

row format serde ‘org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe‘ with serdeproperties

(

  ‘escape.delim‘=‘//‘,

  ‘mapkey.delim‘=‘-‘,

  ‘serialization.format‘=‘|‘,

  ‘colelction.delim‘=‘,‘,

  ‘field.delim‘=‘|‘,

  ‘line.delim‘=‘\n‘,

  ‘serialization.null.format‘=‘‘

)

stored as textfile;

 

 

1.7      测试数据导入表命令

load data local inpath ‘文件路径‘ overwrite into table TABLE_NAME partition (DATA_DATE=‘20130101000000‘);

备注:分区字段的数据不需要写入表文件

1.8      查看表对应的目录和文件

desc formatted tablename;

1.9      查看表对应的数据文件

dfs -ls 文件路径

1.10      查看表文件中的数据

dfs –cat 文件路径

1.11      truncate 分区

truncate table TABLE_NAME partition (sum_start_dttm=20131001000000);

 

1.12      删除分区

ALTER TABLE  TABLE_NAME  DROP PARTITION (sum_start_dttm = 20131001000000);

 

 

 

 

 

 

HIVE入门操作,布布扣,bubuko.com

HIVE入门操作

标签:dfs   hive   

原文地址:http://blog.csdn.net/mygrowth/article/details/26082801

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!