hadoop streaming允许我们使用任何可执行脚本来处理按行组织的数据流,数据取自UNIX的标准输入STDIN,并输出到STDOUT
通过设定mapper为‘RandomSample.py 10’,我们按十分之一的采样率,没有设定特殊的reducer,一般默认使用IdentityReducer(把输入直接转向输出)
通过HDFS的命令getMerge(输出合并)或其他文件操作,可以获得...
分类:
其他好文 时间:
2014-05-18 15:12:21
阅读次数:
380
UNIX和DOS/Windows系统的纯文本格式的换行方式是不同的,基于DOS/Windows的文本文件在每一行末尾有一个CR(回车)和LF(换行),而UNIX文本只有一个换行。
如果想将一个Unix文本转换为Windows文本,可以使用如下的sed命令行
sed -e 's/$/\r/' myunix.txt > mywin.txt
在该脚本中,'$'规则表达式将与...
简介grep (global search regular expression(RE)
and print out the
line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgr...
分类:
系统相关 时间:
2014-05-18 02:10:16
阅读次数:
529
简介在共享内存的多处理器结构中,可以用线程来实现并行。对于UNIX系统,IEEE POSIX
1003.1c标准规定了C语言线程编程接口的标准。这份标准的实现就是POSIX threads,
或者称为Pthreads.本文开始先介绍线程的基本概念,动机和设计方面的一些考虑。 接下来是Pthreads...
分类:
编程语言 时间:
2014-05-17 21:32:58
阅读次数:
464
file_open_mode上传档案的权限,与chmod
所使用的数值相同。如果希望上传的文件可以执行,设此值为0777。local_umask=022
这是指定本地用户上传后的文件权限设置umask是unix操作系统的概念,umask决定目录和文件被创建时得到的初始权限umask = 022 时,...
分类:
其他好文 时间:
2014-05-17 21:23:11
阅读次数:
407
$ su - rootPassword:su: Authentication
failureSorry.这时候输入$ sudo passwd rootEnter new UNIX password:Retype new UNIX
password:passwd: password updated s...
分类:
其他好文 时间:
2014-05-17 20:08:38
阅读次数:
241
转载自:http://blog.163.com/henry_hlh/blog/static/17039507420124211841298/Unix中的函数select和poll用来,支持Unix中I/O复用的功能,在Unix中I/O模型可以分为以一几种:(1)阻塞I/O(2)非阻塞I/O(3)I/...
分类:
系统相关 时间:
2014-05-17 14:59:21
阅读次数:
431
简介puppet是一种Linux、Unix、windows平台的集中配置管理系统;使用自有的puppet描述语言,可管理配置文件、用户、cron任务、软件包、系统服务等,puppet把这些系统实体称之为资源;puppet的设计目标是简化对这些资源的管理以及妥善处理资源间的依赖关系puppet的基础架构puppe..
分类:
其他好文 时间:
2014-05-16 02:00:32
阅读次数:
3027
sendfd.c
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define ERR_EXIT(m) do { perror(m); \...
分类:
其他好文 时间:
2014-05-16 01:27:02
阅读次数:
294
直接上图这里推荐使用SecureCRT,SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序,简单的说是Windows下登录UNIX或Linux服务器主机的软件。SecureCRT支持SSH,同时支持Telnet和rlogin协议。Azure上创建的linux虚拟机缺省是没有root权限的,用户也无法用root登录。要用root..