Explain
Explain是Pig提供的调试工具,使用explain可以输出Pig Lation的执行计划。值得一提的是,explain支持-dot选项,将执行计划以DOT格式输出, (DOT是一种图形描述语言,请参考http://zh.wikipedia.org/zh/DOT%E8%AF%AD%E8%A8%80)
代码实现详见org.apache.pig.impl.plan.DotPla...
分类:
其他好文 时间:
2014-05-07 06:03:35
阅读次数:
350
eshell是emacs shell的简称,是emacs自带的shell.开始设置的时候还在想是否要找到它的key map (eshell-mode-map?).
原来它是采用hook设置,如下所示
(add-hook 'eshell-mode-hook
(lambda ()
(local-set-key (kbd "C-j") 'switch-to...
分类:
其他好文 时间:
2014-05-07 05:25:39
阅读次数:
253
1.shell介于操作系统与用户之间,负责解释命令行
2./etc/shells 记录了系统支持的有效登录的shell
3./etc/passwd 最后一位可以看到用户默认的shell
4.直接输入shell的名称 可以切换shell
5.shell命令的记录可以用history查看 history -c 清除
历史命令存放在.bash_history文件中
...
分类:
其他好文 时间:
2014-05-07 05:11:21
阅读次数:
244
本文是Pig系统分析系列中的最后一篇了,主要讨论如何扩展Pig功能,不仅介绍Pig本身提供的UDFs扩展机制,还从架构上探讨Pig扩展可能性。
补充说明:前两天同事发现twitter推动的Pig On Spark项目:Spork,准备研究下。
UDFs
通过UDFs(用户自定义函数),可以自定义数据处理方法,扩展Pig功能。实际上,UDFS除了使用之前需要register/define外,和...
分类:
其他好文 时间:
2014-05-07 05:10:44
阅读次数:
567
这里介绍一下hadoop的组成, hadoop主要由两部分组成,,一个是hdfs,另一个是mapreduce
这两个部分在hadoop 2.2.0中分别用start-dfs.sh和start-yarn.sh启动。mapreduce 在2.0版本中有了一个新名字yarn.
dfs 主要用来启动 namenode 和 datanode, namenode既是是传说中的matser, datanod...
分类:
其他好文 时间:
2014-05-07 04:33:35
阅读次数:
359
MapReduce2.0(Yarn)
MapReduce2.0是在Hadoop0.23开始采用的,叫做MapReduce2.0或者MRv2或者Yarn。
MRv2的主要思想是把jobtracker的任务分为两个基本的功能,一个是资源管理,一个是任务监控,这两个任务分别用不同的进程来运行。这个想法使拥有一个全局的资源管理器(ResourceManager)和每个应用程序的应用...
分类:
其他好文 时间:
2014-05-07 04:05:06
阅读次数:
272
Ubuntu14下编译64位Hadoop2.4...
分类:
其他好文 时间:
2014-05-07 03:07:30
阅读次数:
256
bash是linux上默认的shell,可以使用tab补全,上下键切换历史命令等。
客户的服务器忽然更改成了AIX,telnet上去一看,晕,竟然默认的是ksh,用起来感觉很别扭,还是安装bash吧
安装过程如下:
1、下载bash的rpm安装包
2、传到AIX上后,直接用RPM解开:
# rpm -...
分类:
其他好文 时间:
2014-05-06 18:59:04
阅读次数:
407
写脚本:写的是维护工具,也是写脚本的目的,用途shell,直译是壳shell脚本是面向过程的#!/bin/bash是指此脚本是用那种shell解释执行的,是特殊的表示符/etc/profile:给用户加载最基本的环境变量,配置全局变量~/.bash_profile:个人环境/etc/bashrc:配置别名或shell选项====..
分类:
其他好文 时间:
2014-05-06 17:25:18
阅读次数:
262
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
最常用的就是多表关联查询,主要讲解下join、outer join和semi join的具体使用。
join是最简单的关联操作,两边关联只取交集。
outer join分为left outer join、rig...
分类:
其他好文 时间:
2014-05-06 15:01:38
阅读次数:
269