码迷,mamicode.com
首页 >  
搜索关键字:hadoop集群    ( 910个结果
1、Hadoop常见问题
1、简要描述如何安装配置一个apache开源版hadoop,描述即可 (1)解压Hadoop (2)配置JDK,防火墙、Hadoop环境 (3)修改Hadoop配置 (4)格式化namenode,对数据缓存的的路径进行格式化 (5)启动Hadoop 2、请列出正常工作的hadoop集群中hadoop ...
分类:其他好文   时间:2020-07-03 00:53:22    阅读次数:83
YARN资源调度框架
Yarn资源调度系统 一、课前准备 1. 三个节点的hadoop集群 二、课堂主题 1. yarn架构、核心组件 2. yarn应用提交过程 3. yarn的调度策略 4. yarn的优化 三、课堂目标 1. 数据yarn资源的任务调度原理 2. 熟练对yarn集群进行维护 3. 了解如何使用YAR ...
分类:其他好文   时间:2020-06-25 23:50:34    阅读次数:115
MapReduce并行编程模型
一、课前准备 1. 3节点hadoop集群 2. 安装IDEA 3. 安装maven并配置环境变量 二、课堂主题 1. 围绕MapReduce分布式计算讲解 三、课堂目标 1. 理解MapReduce编程模型 2. 独立完成一个MapReduce程序并运行成功 3. 了解MapReduce工程流程 ...
分类:其他好文   时间:2020-06-24 00:32:41    阅读次数:54
[AWS][大数据][Hadoop] 使用EMR做大数据分析
实验包括:1.使用EMR创建Hadoop集群2.定义schema,创建示例表。3.通过HiveQL分析数据,并将分析结果保存到S3上4.下载已经分析结果数据。Task1:创建一个S3桶创建一个存储桶比如hadoop202006…Task2:创建EMR集群这里我解释一下Hadoop集群中的一些组件,了解大数据的同学直接忽略就好。ApacheHadoop:在分布式服务器集群上存储海量数据并运行分布式分
分类:其他好文   时间:2020-06-22 09:17:08    阅读次数:174
yarn的调度器以及它们的区别
yarn 一共有3个类型的调度器:FIFO调度器、容量调度器、公平调度器。 1,FIFO调度器。先进先出,队列中同一时间只有一个任务在运行。该任务独占整个集群的资源。 2,容量调度器。多队列,每个队列内部先进先出,同一个队列同时间只有一个任务在运行,任务的并行度为队列的个数。 3,公平调度器。同个队 ...
分类:其他好文   时间:2020-06-16 11:35:39    阅读次数:107
hadoop集群搭建必须要配置的8个配置文件
4个site.xml文件和 3个env.sh文件和1个slave文件 1,core-site.xml 2,hdfs-site.xml 3,mapred-site.xml 4,yarn-site.xml 5,hadoop-env.sh 6,mapred-env.sh 7,yarn-env.sh 8,s ...
分类:其他好文   时间:2020-06-14 17:07:49    阅读次数:141
HBase安装部署
实验环境 虚拟机数量:3 系统版本:Centos 7.5 Hadoop版本:Apache Hadoop 2.7.3 Zookeeper版本:Apache zookeeper-3.4.10. HBase版本:Apache HBase 1.2.6 1.启动Hadoop集群 在master启动Hadoop ...
分类:其他好文   时间:2020-06-10 11:05:53    阅读次数:63
在hadoop集群下启动hbase的方法
hbase已经配置好 开始使用hbase时 先启动hadoop集群 start-all.sh(前提是在bashrc中配置export PATH=$PATH:$HADOOP_HOME/sbin export PATH=$PATH:$HAOOP_HOME/bin) 然后start-hbase.sh,启动 ...
分类:其他好文   时间:2020-06-08 00:39:09    阅读次数:68
Centos7安装部署Hadoop集群
简介Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput
分类:其他好文   时间:2020-06-06 23:16:21    阅读次数:84
Hadoop简介
Hadoop 简介: 两大核心:HDFS+MapReduce Hadoop1.0,Hadoop2.0 Linux:基础 shell,sudo Hadoop集群的部署与使用 先访问nameNode 存储DataNode JobTracker TaskTracker 分布式文件系统 伪分布式:就是吧名称 ...
分类:其他好文   时间:2020-05-29 17:44:12    阅读次数:71
910条   上一页 1 2 3 4 5 6 ... 91 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!