1、概念 HBase是一个分布式的NoSQL数据库,其特点高可靠、高性能、面向列、可伸缩。 适合存储大表数据 ,并且可实时读写大表数据。大表:表的规模可以达到数十亿行以及数百万列 表结构稀疏。稀疏:对于为空的列,并不占用存储空间 数据底层存储于Hadoop HDFS分布式文件系统。 利用ZooKee ...
分类:
其他好文 时间:
2021-02-19 13:36:07
阅读次数:
0
Hadoop的广义与狭义之分 狭义的Hadoop:指的是一个框架,Hadoop是由三部分组成:HDFS:分布式文件系统--》存储;MapReduce:分布式离线计算框架--》计算;Yarn:资源调度框架 广义的Hadoop:广义的Hadoop不仅仅包含Hadoop框架,除了Hadoop框架之外的一些 ...
分类:
其他好文 时间:
2020-06-30 22:14:42
阅读次数:
67
HDFS分布式文件系统 一、课前准备 1. 安装VMware 15虚拟化软件 2. 安装Centos 7虚拟机3个 3. 安装3节点的hadoop2.X集群 4. 某台虚拟机节点安装IDEA 二、课堂主题 本堂课主要围绕HDFS进行讲解,主要包括三方面 1. 架构原理 2. 核心概念 3. HDFS ...
分类:
其他好文 时间:
2020-06-23 00:55:02
阅读次数:
109
1.Hadoop的整体框架 Hadoop是由许多元素构成的,最核心的是HDFS(分布式文件系统),它存储了Hadoop集群中所有DataNode文件,HDFS的上一层是MapReduce引擎,MapReduce是一种计算模型,用以进行大数据量的计算。 HDFS HDFS是Hadoop项目的核心子项目 ...
分类:
其他好文 时间:
2020-04-27 13:27:50
阅读次数:
70
本周花费较多时间在手头的一个深度学习项目上,对于java的实战仅限于课堂的练习代码。 本周所花上机时间27小时,代码量共计1760行,其中,java代码940行,python代码820行。 本周发表博客三篇(关于HDFS分布式文件系统2篇,课堂实战项目一篇) 本周学到的内容有: (1)redis集群 ...
分类:
其他好文 时间:
2020-03-14 19:55:54
阅读次数:
47
2020.2.2今天的寒假生活学习了了解Spark 内存计算框架.Hadoop使用数据复制来实现容错性,而Spark使用RDD数据存储模型来实现数据的容错性。 了解了 hadoop框架 中的 HDFS(分布式文件系统) Mapreduce(分布式计算框架) map函数 Reduce (函数) YAR ...
分类:
其他好文 时间:
2020-02-02 21:55:13
阅读次数:
73
HDFS分布式文件系统概述 一、首先需要准备N台linux服务器 学习阶段,用虚拟机即可! 先准备4台虚拟机:1个namenode节点 + 3 个datanode 节点 二、修改各台机器的主机名和ip地址 主机名: hdp01 对应的ip地址:192.168.11.25 主机名: hdp02 对应的 ...
分类:
其他好文 时间:
2020-01-01 09:29:00
阅读次数:
85
2019-11-24 20:24:56 1.产生密钥对: 可以看到.ssh目录下多了两个文件 2.将每台机器的公钥复制给其他机器。 3.此时再次开启Hadoop就不需要输入4次密码了 将文件放到HDFS分布式文件系统中 ...
分类:
其他好文 时间:
2019-11-24 23:55:29
阅读次数:
170
HDFS 1.hdfs整体工作机制: 1>hdfs:分布式文件系统。 hdfs:分布式文件系统 hdfs有着文件系统共同的特征: 2>有目录结构,顶层目录是: / 3>系统中存放的就是文件 4>系统可以提供对文件的:创建、删除、修改、查看、移动等功能 2.hdfs跟普通的单机文件系统有区别: 1>单 ...
分类:
其他好文 时间:
2019-11-17 23:55:37
阅读次数:
136