码迷,mamicode.com
首页 >  
搜索关键字:hive-sql    ( 115个结果
Hadoop Hive sql语法详解
Hadoop Hive sql语法详解 Hadoop Hive sql语法详解 Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL ...
分类:数据库   时间:2016-04-30 13:01:11    阅读次数:287
详解Hive的架构、工作原理及安装步骤
一、Hive是什么?   Hive 是基于 Hadoop 构建的一套数据仓库分析系统,它提供了丰富的 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中的数据, 可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,可以将 SQL 语句转换为 MapReduce 任务进行运行,通过自己的 SQL 去 查询分析需要的内容,这套 SQL 简称 Hive SQL。    二...
分类:其他好文   时间:2016-04-29 19:39:54    阅读次数:366
详解Hive的架构及安装步骤
一、Hive是什么?   Hive 是基于 Hadoop 构建的一套数据仓库分析系统,它提供了丰富的 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中的数据, 可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,可以将 SQL 语句转换为 MapReduce 任务进行运行,通过自己的 SQL 去 查询分析需要的内容,这套 SQL 简称 Hive SQL。    二...
分类:其他好文   时间:2016-04-23 12:01:58    阅读次数:238
Hive SQL的编译过程
Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。 在几次升级Hive的过程中,我们遇到了一些大大小小的问题。通过向社区 ...
分类:数据库   时间:2016-04-15 11:43:18    阅读次数:244
深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布式缓存(企业Hadoop应用核心产品)
一、本课程是怎么样的一门课程(全面介绍) 1.1、课程的背景 作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成,如我所在的电商。 Hive在企业云计算平台发挥的作用和影响愈来愈大,如何优化提速已经显得至关重 ...
分类:数据库   时间:2016-04-12 07:11:13    阅读次数:220
Hive 12、Hive优化
要点:优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜。 理解hadoop的核心能力,是hive优化的根本。 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜。 2.对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如
分类:其他好文   时间:2016-02-26 21:59:40    阅读次数:274
YARN批处理方式kill Applications解决方案
前言在使用hadoop集群的时候,所有的任务都是最终以Application的形式跑在集群中,不管你是自己写的MR程序亦或是你写的hive sql转化成的mr任务,最终都是以Application应用的身份在跑.这些Application跑完之后,这些信息在jobHistory中就可以看了,可以说hadoop在这方面做得真的非常完整.但是完善归完善.但是jobHistory可以说是一种"事后分析"...
分类:移动开发   时间:2016-01-05 09:49:49    阅读次数:305
写hive sql和shell脚本时遇到几个蛋疼的问题!
错误一:Hive的where后不能用字段的别名,错误二:hive的groupby中不能用自己定义函数,否则报错(用嵌套select取代)错误三:运行:$ ./hive_game_operationstatis5.sh时,报错信息例如以下:./hive_game_operationstatis5.sh...
分类:数据库   时间:2016-01-04 10:11:48    阅读次数:338
Hive SQL执行流程分析
转自 http://www.tuicool.com/articles/qyUzQj最近在研究Impala,还是先回顾下Hive的SQL执行流程吧。Hive有三种用户接口:cli (Command line interface)bin/hive或bin/hive –service cli命令行方式(默...
分类:数据库   时间:2015-11-04 19:19:28    阅读次数:280
Spark(Hive) SQL中UDF的使用(Python)
相对于使用MapReduce或者Spark Application的方式进行数据分析,使用Hive SQL或Spark SQL能为我们省去不少的代码工作量,而Hive SQL或Spark SQL本身内置的各类UDF也为我们的数据处理提供了不少便利的工具,当这些内置的UDF不能满足于我们的需要时,Hi...
分类:数据库   时间:2015-11-02 20:49:04    阅读次数:368
115条   上一页 1 ... 6 7 8 9 10 ... 12 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!