码迷,mamicode.com
首页 >  
搜索关键字:hadoop hbase    ( 16410个结果
hadoop框架hdfs、mapreduce、yarn三大组件内容
Hadoop是什么?1.hadoop是一个由Apache基金会所开发的分布式系统基础架构。2.主要解决,海量数据的储存和海量数据的分析计算问题。3.广义来说,hadoop通常是指一个更广泛的概念 Hadoop生态圈。 Hadoop三大发行版本Hadoop三大发行版本:Apache、Cloudera、 ...
分类:其他好文   时间:2020-07-26 22:58:58    阅读次数:69
大数据一阶段总结
1 Hadoop是什么 1.hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2.主要解决,海量数据的储存和海量数据的分析计算问题。 3.广义来说,hadoop通常是指一个更广泛的概念 Hadoop生态圈。 Hadoop三大发行版本 Hadoop三大发行版本:Apache、Clou ...
分类:其他好文   时间:2020-07-26 22:58:28    阅读次数:95
hadoop中mapReduce整理
1.1 MapReduce定义 1.2 MapReduce优缺点 1.2.1 优点 1.2.2 缺点 1.3 MapReduce核心思想 1)分布式的运算程序往往需要分成至少2个阶段。 2)第一个阶段的MapTask并发实例,完全并行运行,互不相干。 3)第二个阶段的ReduceTask并发实例互不 ...
分类:其他好文   时间:2020-07-26 19:40:01    阅读次数:67
hadoop-hdfs
4 大数据技术之Hadoop(HDFS) 第1章 HDFS概述 1.1 HDFS产出背景及定义 1.2 HDFS优缺点 1.3 HDFS组成架构 1.4 HDFS文件块大小(面试重点) 第2章 HDFS的Shell操作(开发重点) 1.基本语法 bin/hadoop fs 具体命令 OR bin/h ...
分类:其他好文   时间:2020-07-26 19:35:03    阅读次数:94
Hbase存取速度为啥快---第二弹
版权声明:本文为CSDN博主「九品下」的原创文章 原文链接:https://blog.csdn.net/w892824196/article/ HBase能提供实时计算服务主要原因是由其架构和底层的数据结构决定的,即由LSM-Tree(Log-Structured Merge-Tree) + HTa ...
分类:其他好文   时间:2020-07-26 19:15:06    阅读次数:69
hbase 基础 —— 架构
典型的主从架构。其中 RegionServers 负责与客户端的交互,访问数据 HMaster 负责 Region 分配,DDL(create, delete tables) 操作。 1. Regions hbase table 根据 RowKey 划分成多个 Region,Region 包含所划分 ...
分类:其他好文   时间:2020-07-26 15:21:40    阅读次数:62
hbase 基础 —— 概念简介
1. 简要介绍 HBase 是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的 BigTable 建模,实现的编程语言为 Java。它是 Apache 软件基金会的 Hadoop 项目的一部分,运行于 HDFS 文件系统之上,为 Hadoop 提供类似于 BigTable 规模的服务,可 ...
分类:其他好文   时间:2020-07-26 01:59:15    阅读次数:89
Hadoop基础(五十):压缩和存储(二)
4 开启 Reduce 输出阶段压缩 当 Hive 将 输 出 写 入 到 表 中 时 , 输 出 内 容 同 样 可 以 进 行 压 缩 。 属 性hive.exec.compress.output 控制着这个功能。用户可能需要保持默认设置文件中的默认值 false, 这样默认的输出就是非压缩的纯 ...
分类:其他好文   时间:2020-07-24 21:30:31    阅读次数:69
NoSQL和SQL怎么选用?
NoSQL 有分很多种,其中key-value NoSQL (Redis, MemcacheD, etc) 的选用相对比较清楚些,大多是当后端Data storage的cache层来用。这篇主要想请教Column Family NoSQL (e.g. Cassandra, Hbase) 和SQL之间 ...
分类:数据库   时间:2020-07-24 15:31:56    阅读次数:77
大型分布式系统现场,阿里大牛带你贯彻理解分布式系统
分布式系统分布式系统从当初的CORBA到EJB,Web和SOA,从集群到现在的NoSQL云计算和大数据Hadoop等分布式系统,横向水平扩展Scalaout/in是分布式系统设计的一个特点,可靠性容错性是两个质量指标。什么是分布式系统?一大批服务器组成一个集合,对于用户来说仍然是一个整体连贯系统。A.Tanenbaum定义:分布式网络的计算机中的组件之间协调动作是通过消息进行通讯。G.Coulou
分类:其他好文   时间:2020-07-24 13:30:07    阅读次数:93
16410条   上一页 1 ... 27 28 29 30 31 ... 1641 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!