码迷,mamicode.com
首页 >  
搜索关键字:hadoop1    ( 421个结果
Elasticsearch 7.6集群搭建(基于Centos7.4)
1、下载安装包elasticsearch oss 7.6.2 linux x86_64.tar.gz到hadoop1 "elasticsearch oss 7.6.2 linux x86_64.tar.gz" 2、远程传输到hadoop2、hadoop3节点 scp r elasticsearch ...
分类:其他好文   时间:2020-05-05 10:46:38    阅读次数:110
Yarn基础组件及提交流程
下面记录下YARN的服务组件和提交流程的基础知识,主要参考文末博文,其中 提交流程部分直接引用 ,感谢被引用的博主 "PeTu" 。 YARN介绍 YARN是在Hadoop2.0引入的,它的出现是历史的产物。在Hadoop1.0版本时,有JobTracker和TaskTracker来完成资源调度和任 ...
分类:其他好文   时间:2020-05-04 19:18:43    阅读次数:85
zookeeper集群搭建
注:zookeeper集群节点数必须为奇数,满足leader选举算法(当选leader的节点所需支持节点数过半的原则),且 =3 1、下载zookeeper安装包 2、远程传输到hadoop2、hadoop3节点上 scp r zookeeper 3.4.10.tar.gz root@hadoop2 ...
分类:其他好文   时间:2020-05-02 22:43:01    阅读次数:61
Hadoop面试整理
(1)Hadoop1.x和2.x之间的区别 Hadoop 1.0内核主要由两个分支组成:MapReduce和HDFS,在高可用、扩展性等方面存在问题 1)HDFS存在的问题 1.NameNode单点故障,难以应用于在线场景。 2.NameNode压力过大,且内存受限,影响扩展性。 2)MapRedu ...
分类:其他好文   时间:2020-03-28 17:42:52    阅读次数:69
flume 集群安装监听测试
1、在已经搭建好集群基础上,配置监听机器配置,主机名 hadoop1,flume-conf.properties配置文件 # Licensed to the Apache Software Foundation (ASF) under one # or more contributor licens ...
分类:Web程序   时间:2020-03-18 23:45:55    阅读次数:95
认识大数据以及hadoop
1、BigData是什么?大数据(BigData),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据包括结构化、半结
分类:其他好文   时间:2020-03-18 14:04:51    阅读次数:105
Hadoop简介
大数据开发总体架构: Hadoop是大数据开发所使用的一个核心框架。使用Hadoop可以方便的管理分布式集群,将海量数据分布式的存储在集群中,并使用分布式并行程序来处理这些数据。 Hadoop由许多子系统组成,如下图: Hadoop1.x与2.x的对比: YARN:管理集群资源(内存、CPU) ...
分类:其他好文   时间:2020-03-17 19:30:09    阅读次数:49
在centos7上安装hadoop
1.使用hadoop是需要jdk环境的,因为hadoop里面有java程序,而运行java程序需要jdk。 2.从宿主机上传文件到虚拟机有很多方法,我选择的是在虚拟机安装lrzsz,安装lrzsz命令行:yum install y lrzsz 3.确定好软件安装路径 /opt 工作目录 /opt/i ...
分类:其他好文   时间:2020-02-20 15:34:25    阅读次数:143
Hadoop2.0之YARN组件
官方文档:https://hadoop.apache.org/docs/stable/,目前官方已经是3.x,但yarn机制没有太大变化 一、简介 在Hadoop1.0中,没有yarn,所有的任务调度和资源管理都是MapReduce自己来做,所以在Hadoop1.0中,最核心的节点是JobTrack ...
分类:其他好文   时间:2020-02-07 16:24:04    阅读次数:62
hadoop之hadoop基础介绍
hadoop是什么? 是一个分布式基础架构,主要解决海量数据存储以及数据分析计算问题。 hadoop三大发行版本? Apache、clourdera、Hortonworks hadoop优势? 高可靠、高扩展、高效、高容错 hadoop1.x和2.x的区别? HDFS(hadoop distribu ...
分类:其他好文   时间:2020-01-30 14:29:07    阅读次数:79
421条   上一页 1 2 3 4 ... 43 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!