码迷,mamicode.com
首页 >  
搜索关键字:hdfs hadoop    ( 15816个结果
Hadoop Yarn工作机制 Job提交流程
(1)MR程序提交到客户端所在的节点。(2)YarnRunner向ResourceManager申请一个Application。(3)RM将该应用程序的资源路径返回给YarnRunner。(4)该程序将运行所需资源提交到HDFS上。(5)程序资源提交完毕后,申请运行mrAppMaster。(6)RM ...
分类:其他好文   时间:2020-07-04 15:14:37    阅读次数:54
Hadoop 切片机制
切片机制源码: ①for (FileStatus file: files) 每个文件单独切片。 ②long length = file.getLen() 获取文件大小。 ③while (((double) bytesRemaining)/splitSize > SPLIT_SLOP) SPLIT_S ...
分类:其他好文   时间:2020-07-04 11:49:16    阅读次数:106
Flume(一)【概述】
一.Flume定义 ? Flume是Cloudera公司提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 ? Flume最主要的作用就是,实时读取服务器的本地磁盘的数据,将数据写入到HDFS。 二.Flume基础架构 ? Flume基本组成架构如下 ...
分类:Web程序   时间:2020-07-03 23:51:14    阅读次数:112
Hadoop MapReduce工作流程
工作流程1 Map Task MR工作流程2 Reduce Task 1)提交切片信息,jar包,和xml配置文件到yarn。2)Yarn ResourceManager启动一个MR AppMaster。3)AppMaster根据切片信息启动相应数量的Map Task。4)Map Task取读取按照 ...
分类:其他好文   时间:2020-07-03 23:29:37    阅读次数:60
Docker中提交任务到Spark集群
1. 背景描述和需求 数据分析程序部署在Docker中,有一些分析计算需要使用Spark计算,需要把任务提交到Spark集群计算。 接收程序部署在Docker中,主机不在Hadoop集群上。与Spark集群网络互通。 需求如下 1、在Docker中可程序化向Spark集群提交任务 2、在Docker ...
分类:其他好文   时间:2020-07-03 19:06:43    阅读次数:62
【HDFS篇03】HDFS客户端操作 --- 开发环境准备
存储越困难,提取越容易 HDFS客户端操作 开发环境准备 步骤一:编译对应HadoopJar包,配置Hadoop变量 步骤二:创建Maven工程,导入pom依赖 <dependencies> <dependency> <groupId>junit</groupId> <artifactId>juni ...
分类:其他好文   时间:2020-07-03 17:56:31    阅读次数:59
ol7.7安装部署4节点hadoop 3.2.1分布式集群学习环境
准备4台虚拟机,安装好ol7.7,分配固定ip192.168.168.11 12 13 14,其中192.168.168.11作为master,其他3个作为slave,主节点也同时作为namenode的同时也是datanode,192.168.168.14作为datanode的同时也作为second... ...
分类:其他好文   时间:2020-07-03 12:23:28    阅读次数:70
1、Hadoop常见问题
1、简要描述如何安装配置一个apache开源版hadoop,描述即可 (1)解压Hadoop (2)配置JDK,防火墙、Hadoop环境 (3)修改Hadoop配置 (4)格式化namenode,对数据缓存的的路径进行格式化 (5)启动Hadoop 2、请列出正常工作的hadoop集群中hadoop ...
分类:其他好文   时间:2020-07-03 00:53:22    阅读次数:83
HDFS操作实验
HDFS实验 学习了中国MOOC上的《大数据技术原理与应用》,然后找到实验开始学习。我认为这门课被认为是入门的专业课是可以的,很多地方都只是一个简单的描述一下体系结构,工作方式等等,这就足够了,多了也听不懂。学习完了这门课,就是深似海的感觉,对讲的内容总是一知半解,可能自己理论确实不太行趴++ 但是 ...
分类:其他好文   时间:2020-07-02 21:59:02    阅读次数:66
数据仓库 业务数仓 ODS层
ODS层数据不做任何处理,完全仿照业务数据库中的表字段,一模一样的创建ODS层对应表。 8张表建表语句: ①用sqoop把导入到HDFS的时候,加了参数--fields-terminated-by "\t",因此这里ODS层建表的时候也注意相同的分隔符。 ②不管是全量导入还是其他形式,都使用分区表, ...
分类:其他好文   时间:2020-07-01 23:46:38    阅读次数:91
15816条   上一页 1 ... 38 39 40 41 42 ... 1582 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!