标签:Hadoop
1.hadoop是什么狭义: Hadoop软件(HDFS、MapReduce、Yarn)
广义: 以hadoop为主的生态圈
HDFS: 分布式文件管理系统 存储
MapReduce: 执行引擎 计算
Yarn: 资源(memory cpu)和作业调度平台 资源
注意authorized_keys权限 要改为600
NameNode,DataNode,SecondaryNameNode
128m一个块,就是4个块
1500M
读是inputStream
写是outputStream
管理文件系统的命名空间
读写文件的数据块
定期合并fsimage+editlog文件为新的fsimage 推送给namenode 俗称检查点动作
就近原则,放当前节点
jps就是把/tmp下对应用户的进程信息显示出来,并不代表实际的进程信息
保存进程号
#!/bin/bash
b=`date`
if判断里的条件开头和结尾都要空格
脚本内 #!/bin/bash -x
执行参数 sh -x xxx.sh
su - hadoop -c date
标签:Hadoop
原文地址:http://blog.51cto.com/10814168/2118668