搜索关键字：数据倾斜，搜索到141个结果！码迷,mamicode.com！

hive 优化（转）

Hive优化 Hive优化目标在有限的资源下，执行效率更高常见问题数据倾斜 map数设置 reduce数设置其他在有限的资源下，执行效率更高数据倾斜 map数设置 reduce数设置其他 Hive执行 HQL --> Job --> Map/Reduce 执行计划 explain [e ...

分类：其他好文时间：2018-08-15 12:04:09 阅读次数：164

深入理解hadoop数据倾斜

深入理解hadoop之数据倾斜 1、什么是数据倾斜我们在用map /reduce程序执行时，有时候会发现reduce节点大部分执行完毕，但是有一个或者几个reduce节点运行很慢，导致整个程序的处理时间很长，这是因为某一个key的条数比其他key多很多（有时是百倍或者千倍之多），这条key所在的r ...

分类：其他好文时间：2018-07-14 13:04:56 阅读次数：475

spark数据倾斜

数据倾斜的主要问题在于，某个分区数量很巨大，在做map运算的时候，将会发生别的分区task很快计算完成，但是某几个分区task的计算成为了系统的瓶颈，明显超过其他分区时间； 1.方案：Kafka的随机主题如果kafka的topic和分区关联，而且kafka是专用的，那么其实kafka如果能够和随机 ...

分类：其他好文时间：2018-07-07 23:29:58 阅读次数：250

hive-分析函数

bitmap -------------- 位图/位映射。 5 hive -------------- 分区表 udtf函数 wordcount lateral view //和udtf配合使用。 order by //数据倾斜 sort by ... ...

分类：其他好文时间：2018-06-25 17:55:00 阅读次数：195

hive案例

数据倾斜：操作? Join on a.id=b.id? Group by? Count Distinct count(groupby)? 原因? key分布不均导致的? 人为的建表疏忽? 业务数据特点? 症状? 任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个） ...

分类：其他好文时间：2018-05-08 21:00:14 阅读次数：171

Oracle面试题

0.绑定变量的优缺点及使用场合分别是什么？优点：能够避免SQL的硬解析以及与之相关的额外开销（SQL语法、语义的分析、逻辑分析、生成较佳的执行计划等开销），提高执行效率。缺点：如果在表存在数据倾斜、数据分布不均匀列上使用绑定变量，会造成优化器忽略其具体值，导致生成错误低效的执行计划，降低执行效率 ...

分类：数据库时间：2018-05-01 00:31:41 阅读次数：258

Spark学习之路（九）SparkCore的调优之数据倾斜调优

摘抄自：https://tech.meituan.com/spark-tuning-pro.html 数据倾斜调优调优概述有的时候，我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜，此时Spark作业的性能会比期望差很多。数据倾斜调优，就是使用各种技术方案解决不同类型的数据倾斜问题，以保证 ...

分类：其他好文时间：2018-04-25 20:10:42 阅读次数：174

Hive学习之路（十九）Hive的数据倾斜

1、什么是数据倾斜？由于数据分布不均匀，造成数据大量的集中到一点，造成数据热点 2、Hadoop 框架的特性 A、不怕数据大，怕数据倾斜 B、Jobs 数比较多的作业运行效率相对比较低，如子查询比较多 C、 sum,count,max,min 等聚集函数，通常不会有数据倾斜问题 3、主要表现任务 ...

分类：其他好文时间：2018-04-15 16:25:44 阅读次数：198

MapReduce数据倾斜的解决方式

数据倾斜：由于数据分布不均匀，造成数据大量的集中到一点，造成数据热点。map /reduce程序执行时，reduce节点大部分执行完毕，但是有一个或者几个reduce节点运行很慢，导致整个程序的处理时间很长，这是因为某一个key的条数比其他key多很多（有时是百倍或者千倍之多），这条key所在的re ...

分类：其他好文时间：2018-04-07 17:43:42 阅读次数：159

大数据数据倾斜

什么是数据倾斜简单的讲，数据倾斜就是我们在计算数据的时候，数据的分散度不够，导致大量的数据集中到了一台或者几台机器上计算，这些数据的计算速度远远低于平均计算速度，导致整个计算过程过慢。相信大部分做数据的童鞋们都会遇到数据倾斜，数据倾斜会发生在数据开发的各个环节中，比如：用Hive算数据的时候r ...

分类：其他好文时间：2018-03-13 01:11:29 阅读次数：199

共141条上一页 1 ... 5 6 7 8 9 ... 15 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)