码迷,mamicode.com
首页 >  
搜索关键字:snappy cdh hadoop    ( 14451个结果
大数据组件
1.大数据架构图谱 文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 GlusterFS 是一个集群的文件系统 ...
分类:其他好文   时间:2020-11-25 12:06:50    阅读次数:8
Hadoop全分布模式启动集群
一、 初始化工作: 1. 准备三台机器 hostanme IP 用途 master 192.168.0.10 namenode node1 192.168.0.11 datenode node2 192.168.0.12 datenode 在三台机器上做下面的动作 2. 编辑/etc/hosts 1 ...
分类:其他好文   时间:2020-11-23 12:38:36    阅读次数:12
我要进大厂之大数据Hadoop HDFS知识点(1)
01 我们一起学大数据 老刘今天开始了大数据Hadoop知识点的复习,Hadoop包含三个模块,这次先分享出Hadoop中的HDFS模块的基础知识点,也算是对今天复习的内容进行一次总结,希望能够给想学大数据的同学一点帮助,也希望能够得到大佬们的批评和指点!(每个点都很重要,都不能忽视) 02 需谨记 ...
分类:其他好文   时间:2020-11-23 12:18:23    阅读次数:6
docker
@ 1.Docker概述 1.1Docker为什么会出现 一款产品:开发--》上线,需要两套环境!应用环境,应用配置! 开发 运营之间产生问题:我在我的电脑上可以运行!版本更新导致服务不可用!对于运维就很难 开发即运维! 环境配置十分麻烦,每一个机器都要部署环境(集群Redis、ES、Hadoop。 ...
分类:其他好文   时间:2020-11-21 12:47:24    阅读次数:31
认识Hive
认识Hive 从MapReduce到SQL Hive架构 三种安装方式 Hive与关系型数据库的区别 1. 认识Hive 前面我们讲到了mapreduce计算框架,各位需要通过java编码的形式来实现设计运算过程,Hive的设计目的就是为了让精通sql技能而java较弱的分析师能够利用hadoop进 ...
分类:其他好文   时间:2020-11-21 12:33:40    阅读次数:7
yarn初始
yarn是什么: 旧版本MapReduce中的JobTracker/TaskTracker在可扩展性、内存消耗、可靠性和线程模型方面存在很多问题,需要开发者做很多调整来修复。 Hadoop的开发者对这些问题进行了Bug修复,可是由此带来的成本却越来越高,为了从根本上解决旧MapReduce存在的问题 ...
分类:其他好文   时间:2020-11-19 12:56:26    阅读次数:17
大数据平台之权限管理组件 - Aapche Ranger
ApacheRanger简介ApacheRanger提供一个集中式安全管理框架,并解决授权和审计。它可以对Hadoop生态的组件如HDFS、Yarn、Hive、Hbase等进行细粒度的数据访问控制。通过操作Ranger控制台,管理员可以轻松的通过配置策略来控制用户访问权限。Ranger优点:丰富的组件支持(HDFS,HBASE,HIVE,YARN,KAFKA,STORM)提供了细粒度级权限控制(h
分类:其他好文   时间:2020-11-18 13:10:32    阅读次数:10
Hive数据仓库之权限管理
Hadoop/Hive自带权限控制集群安全下需求:支持多组件,最好能支持当前大数据技术栈的主要组件,HDFS、HBASE、HIVE、YARN、KAFKA等支持细粒度的权限控制,可以达到HIVE列,HDFS目录,HBASE列,YARN队列开源,社区活跃,按照现有的集群情况改动尽可能的小,而且要符合业界的趋势。现有方案:Hadoop、Hive本身的权限控制Kerberos安全认证ApacheRange
分类:其他好文   时间:2020-11-18 12:15:31    阅读次数:8
集群版hadoop安装,写给大忙人看的~
导语如果之前的单机版hadoop环境安装满足不了你,集群版hadoop一定合你胃口,轻松入手。目录集群规划前置条件配置免密登录3.1生成密匙3.2免密登录3.3验证免密登录集群搭建4.1下载并解压4.2配置环境变量4.4修改配置4.4分发程序4.5初始化4.6启动集群4.7查看集群提交服务到集群1.集群规划这里搭建一个3节点的Hadoop集群,其中三台主机均部署DataNode和NodeManag
分类:其他好文   时间:2020-11-18 12:13:01    阅读次数:6
hadoop和maven
1、大数据有哪些特点? valume(大量) velocity(高速) variety(多样) value(低价值密度) 2、什么是大数据? 指无法在一定的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信 ...
分类:其他好文   时间:2020-11-16 13:51:20    阅读次数:9
14451条   上一页 1 ... 14 15 16 17 18 ... 1446 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!