一.文件操作 文件操作 类似于正常的linux操作前面加上“hdfs dfs -” 前缀也可以写成hadoop而不用hdfs,但终端中显示 Use of this script to execute hdfs command is deprecated. Instead use the hdfs c ...
分类:
其他好文 时间:
2020-03-14 21:57:13
阅读次数:
58
本周花费较多时间在手头的一个深度学习项目上,对于java的实战仅限于课堂的练习代码。 本周所花上机时间27小时,代码量共计1760行,其中,java代码940行,python代码820行。 本周发表博客三篇(关于HDFS分布式文件系统2篇,课堂实战项目一篇) 本周学到的内容有: (1)redis集群 ...
分类:
其他好文 时间:
2020-03-14 19:55:54
阅读次数:
47
一、MapReduce编程思想 mapReduce编程模型的总结: MapReduce的开发一共有八个步骤其中map阶段分为2个步骤,shuffle阶段4个步骤,reduce阶段分为2个步骤 Map阶段2个步骤 第一步:设置inputFormat类,将我们的数据切分成key,value对,输入到第二 ...
分类:
其他好文 时间:
2020-03-13 19:11:00
阅读次数:
60
首先要了解的是,HDFS采用的是主从架构,即一个主节点(名称节点),多个从节点(数据节点),主节点起到管家作用,负责提供数据目录服务,从节点都是数据节点负责数据存储。 我们都知道文件系统中都是有命名空间的概念的,HDFS也不例外,它的命名空间只有一个,里面包含了目录、文件、块,它的使用和传统的文件体 ...
分类:
其他好文 时间:
2020-03-11 15:42:50
阅读次数:
86
1.1.1 永久性数据结构 namenode的目录结构如下图 (1) VERSION属性文件 namespaceid文件系统命名空间唯一标识。 clusterID是将HDFS集群作为一个整体赋予的唯一标识符。 blockpoolID是数据块池的唯一标识。 CTime是namenode存储系统创建时间 ...
分类:
其他好文 时间:
2020-03-11 10:58:32
阅读次数:
49
把RDD写入到文本文件中 分布式文件系统HDFS的数据读写 JSON文件数据读写 (注scala 2.11.8运行不了) ...
分类:
其他好文 时间:
2020-03-10 21:53:58
阅读次数:
76
HDFS的定义? Hadoop分布式文件管理系统。旨在对不同系统上的文件进行统一的管理。它是一个文件系统,用于存储文件,通过目录树来定位文件,其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。 使用场景? 适合一次写入,多次读出的场景,且不支持文件的修改,适合用来做数据 ...
分类:
其他好文 时间:
2020-03-10 11:56:30
阅读次数:
66
1、访问地址 http://192.168.0.123:8080/dfshealth.html#tab-overview 2、浏览文件 ...
分类:
Web程序 时间:
2020-03-07 12:39:43
阅读次数:
92
MapReduce 基于HDFS 1.环境搭建起来 伪分布式2.MapReduce是基于HDFS之上的 MapReduce计算的内容应该是HDFS上的文件/文件夹3.计算=>统计=>Mapper阶段=>Reduce阶段 MapReduce的编程模型4.Mapper类 继承Mapper类 重写Mapp ...
分类:
其他好文 时间:
2020-03-07 00:12:42
阅读次数:
69
关闭虚拟机之后重启hadoop,想要用删除之前在hdfs运行的output文件,显示: hadoop之Name node is in safe mode 处理方法: bin/hadoop dfsadmin -safemode leave ...
分类:
其他好文 时间:
2020-03-05 15:26:59
阅读次数:
67