搜索关键字：hadoop 集群，搜索到32537个结果！码迷,mamicode.com！

Pig系统分析(6)-从Physical Plan到MR Plan再到Hadoop Job

从Physical plan到Map-Reduce Plan 注：因为我们重点关注的是Pig On Spark针对RDD的执行计划，所以Pig物理执行计划之后的后端参考意义不大，这些部分主要分析流程，忽略实现细节。入口类MRCompiler，MRCompilier按照拓扑顺序遍历物理执行计划中的节点，将其转换为MROperator，每个MROperator都代表一个map-reduce j...

分类：其他好文时间：2014-05-10 08:46:07 阅读次数：366

hadoop优质链接

http://wiki.apache.org/hadoop/FAQ...

分类：其他好文时间：2014-05-07 07:51:10 阅读次数：229

Pig系统分析(7)-Pig实用工具类

Explain Explain是Pig提供的调试工具，使用explain可以输出Pig Lation的执行计划。值得一提的是，explain支持-dot选项，将执行计划以DOT格式输出， (DOT是一种图形描述语言，请参考http://zh.wikipedia.org/zh/DOT%E8%AF%AD%E8%A8%80) 代码实现详见org.apache.pig.impl.plan.DotPla...

分类：其他好文时间：2014-05-07 06:03:35 阅读次数：350

Pig系统分析(8)-Pig可扩展性

本文是Pig系统分析系列中的最后一篇了，主要讨论如何扩展Pig功能，不仅介绍Pig本身提供的UDFs扩展机制，还从架构上探讨Pig扩展可能性。补充说明：前两天同事发现twitter推动的Pig On Spark项目：Spork，准备研究下。 UDFs 通过UDFs（用户自定义函数），可以自定义数据处理方法，扩展Pig功能。实际上，UDFS除了使用之前需要register/define外，和...

分类：其他好文时间：2014-05-07 05:10:44 阅读次数：567

Hadoop 组成

这里介绍一下hadoop的组成， hadoop主要由两部分组成，，一个是hdfs，另一个是mapreduce 这两个部分在hadoop 2.2.0中分别用start-dfs.sh和start-yarn.sh启动。mapreduce 在2.0版本中有了一个新名字yarn. dfs 主要用来启动 namenode 和 datanode， namenode既是是传说中的matser, datanod...

分类：其他好文时间：2014-05-07 04:33:35 阅读次数：359

Hadoop MapReduce2.0（Yarn）

MapReduce2.0（Yarn） MapReduce2.0是在Hadoop0.23开始采用的，叫做MapReduce2.0或者MRv2或者Yarn。 MRv2的主要思想是把jobtracker的任务分为两个基本的功能，一个是资源管理，一个是任务监控，这两个任务分别用不同的进程来运行。这个想法使拥有一个全局的资源管理器（ResourceManager）和每个应用程序的应用...

分类：其他好文时间：2014-05-07 04:05:06 阅读次数：272

Ubuntu14下Hadoop开发<2> 编译64位Hadoop2.4

Ubuntu14下编译64位Hadoop2.4...

分类：其他好文时间：2014-05-07 03:07:30 阅读次数：256

高可用(HA)集群原理概述

一、高可用集群(HighAvailabilityCluster)集群（cluster）就是一组计算机，它们作为一个整体向用户提供一组网络资源。每一个单个的计算机系统都叫集群节点（node）。随着业务的增长，集群通过添加新的节点，满足资源的高可扩展性。计算机硬件和软件易错性不可避免，这样在节点..

分类：其他好文时间：2014-05-06 18:34:44 阅读次数：467

linux之几个命令

whoami：当前登录到系统的有效用户who:显示当前系统上登录的用户都有哪些-r：显示当前的运行级别的who|grep"hadoop" echo$?w：显示谁登陆了，并且正在干什么。（显示的信息比who更详细）last：显示登录的日志，记录登录历史和重启历史-n#：只显示#次的登录信息lastb：/var/log/..

分类：系统相关时间：2014-05-06 16:05:21 阅读次数：506

Hive中join, outer join, semi join区别

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。最常用的就是多表关联查询，主要讲解下join、outer join和semi join的具体使用。 join是最简单的关联操作，两边关联只取交集。 outer join分为left outer join、rig...

分类：其他好文时间：2014-05-06 15:01:38 阅读次数：269

共32537条上一页 1 ... 3243 3244 3245 3246 3247 ... 3254 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)