搜索关键字：reduce，搜索到2830个结果！码迷,mamicode.com！

hive join 空指针异常

2015-07-28 10:03:21,557 Stage-2 map = 100%, reduce = 0% Ended Job = job_1437720498561_1035 with errors Error during job, obtaining debugging information... Examining task ID: task_1437720498561_10...

分类：其他好文时间：2015-07-28 11:05:54 阅读次数：705

MapReduce：详解Shuffle过程

Shuffle过程，也称Copy阶段。reduce task从各个map task上远程拷贝一片数据，并针对某一片数据，如果其大小超过一定的阀值，则写到磁盘上，否则直接放到内存中。官方的Shuffle过程如上图所示，不过细节有错乱，官方图并没有说明partition、sort和combiner具体作...

分类：其他好文时间：2015-07-27 20:29:15 阅读次数：135

MapReduce架构和算法(2)

一个、combiner计划每map它可能会产生大量的输出，combiner的作用是map输出端先做合并。reducer的数据量。 combiner最基本是实现本地key的归并，combiner具有类似本地的reduce功能假设不用combiner，那么，全部的结果都是reduce完毕。效率...

分类：编程语言时间：2015-07-27 16:15:28 阅读次数：102

[Python] Python中的一些特殊函数

本文介绍了Python的几个特殊的函数，包括列表方法的三驾马车filter、map和reduce函数。此外，本文还介绍了Python中装饰器和匿名函数的用法。

分类：编程语言时间：2015-07-26 23:57:04 阅读次数：290

[LeetCode] Search a 2D Matrix II

Well, the idea is to search from thetop-rightelement and then reduce the range for further searching by comparisons betweentargetand the current eleme...

分类：其他好文时间：2015-07-25 13:34:48 阅读次数：131

什么是Spark？

什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的ma...

分类：其他好文时间：2015-07-25 09:29:52 阅读次数：140

hadoop2.6.0的eclipse插件安装

1.安装插件下载插件hadoop-eclipse-plugin-2.6.0.jar并将其放到eclips安装目录->plugins（插件）文件夹下。然后启动eclipse。配置 hadoop 安装目录配置Map/Reduce 视图点击"大象" 在“Map/Reduce Lo...

分类：系统相关时间：2015-07-23 06:44:43 阅读次数：257

mapreduce出现类似死锁情况

在往hbase表里通过bulkload导数据时，某个mapreduce跑了一个多小时还没跑，看yarn界面，发现map还有一小部分没跑完，没跑完的map全在pending，running中没有，同时reduce在copy阶段把资源全用光，导致map没资源去跑，进而导致reduce一直在copy状态等...

分类：其他好文时间：2015-07-22 18:05:01 阅读次数：1700

Python的高级特性4:函数式编程

函数式编程的核心就是把函数当成对象来进行编程。有两个常用到的方法:map/reduce,filter，其中map和filter是内建方法，而reduce不是，所以需要import相关模块。map接收两个参数，第一个参数是函数(处理办法)，第二个参数是一个可迭代对象，而map可以把第二个参数的变量映射...

分类：编程语言时间：2015-07-20 01:16:34 阅读次数：160

python中的reduce

python中的reduce内建函数是一个二元操作函数，他用来将一个数据集合（链表，元组等）中的所有数据进行下列操作：用传给reduce中的函数 func()（必须是一个二元操作函数）先对集合中的第1，2个数据进行操作，得到的结果再与第三个数据用func()函数运算，最后得到一个结果。>>> def...

分类：编程语言时间：2015-07-19 14:51:58 阅读次数：115

共2830条上一页 1 ... 230 231 232 233 234 ... 283 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)