搜索关键字：hive ，搜索到5904个结果！码迷,mamicode.com！

Hive 查询优化总结

一、join优化Join查找操作的基本原则：应该将条目少的表/子查询放在Join操作符的左边。原因是在Join操作的Reduce阶段，位于Join操作符左边的表的内容会被加载进内存，将条目少的表放在左边，可以有效减少发生内存溢出错误的几率。Join查找操作中如果存在多个join，且所有参与join的...

分类：其他好文时间：2014-07-22 22:56:14 阅读次数：238

Hive调优实战

Hive优化总结---by 食人花优化时，把hive sql当做map reduce程序来读，会有意想不到的惊喜。理解hadoop的核心能力，是hive优化的根本。这是这一年来，项目组所有成员宝贵的经验总结。长期观察hadoop处理数据的过程，有几个显著的特征:1.不怕数据多，就怕数据倾斜。2．对j...

分类：其他好文时间：2014-07-22 22:55:15 阅读次数：271

Hadoop的数据管理

Hadoop的数据管理，主要包括Hadoop的分布式文件系统HDFS、分布式数据库HBase和数据仓库工具Hive的数据管理。

分类：其他好文时间：2014-07-22 22:54:13 阅读次数：243

Hive一些参数设置

在使用union all的时候，系统资源足够的情况下，为了加快hive处理速度，可以设置如下参数实现并发执行set mapred.job.priority=VERY_HIGH;set hive.exec.parallel=true;设置map reduce个数-- 设置map capacityset...

分类：其他好文时间：2014-07-19 21:37:25 阅读次数：264

Hive架构层面优化之四常用复杂/低效的统计从源上给出，以避免上层作业过多计算

案例一：trackinfo，基础表处理常用的低性能UDF背景描述：日志信息10分钟加载一次到实时日志表trackreal中（按小时分区），为了保证实时性，在加载的过程中并没有做任何的过滤处理，加载到trackreal表后再过滤非法数据、爬虫数据等，生成按天增量日志表trackinfo，然后根据不同的...

分类：其他好文时间：2014-07-17 13:09:44 阅读次数：226

hive与hbase的区别与联系

共同点：1.hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储区别：2.Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统，HBase是为了支持弥补Hadoop对实时操作的缺陷的项目。3.想象你在操作RMDB数据库，如果是全表扫描...

分类：其他好文时间：2014-07-16 21:30:18 阅读次数：167

sqoop导入数据时间日期类型错误

一个问题困扰了很久，用sqoop import从mysql数据库导入到HDFS中的时候一直报错，最后才发现是一个时间日期类型的非法值导致。hive只支持timestamp类型，而mysql中的日期类型是datetime，当datetime的值为0000-00-00 00:00:00的时候，sqoop import无法将其转换成hive, 然后报错。解决方法是在hive中使用string字段类型。...

分类：其他好文时间：2014-07-15 12:58:08 阅读次数：342

HBase 实战(1)--HBase的数据导入方式

前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇博文重点讲解HBase的数据导入, 描述三种方式, Client API, Bulkload, 以及Hive Over .....

分类：其他好文时间：2014-07-14 15:51:39 阅读次数：288

python 调用hive查询实现类似存储过程

需求：数据仓库中所有表的定义结构保存到新的文件中，保存后类似下面数据，重复的数据只保留7月份即可****************ods_log_info*****************lid string uid string mb_uid string operation string modu...

分类：编程语言时间：2014-07-14 14:29:01 阅读次数：285

Spark SQL源码分析之核心流程

从源代码的角度来看一下Spark SQL的核心执行流程吧...

分类：数据库时间：2014-07-12 21:07:32 阅读次数：299

共5904条上一页 1 ... 577 578 579 580 581 ... 591 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)