HBase是一个分布式的、面向列的开源数据库,该技术来源于Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBas...
分类:
其他好文 时间:
2014-08-23 17:37:31
阅读次数:
323
Sheepdog,是由NTT的3名日本研究员开发的开源项目,主要用来为虚拟机提供块设备。其架构例如以下:以下,我们将从架构、模块等几个方面来介绍下:一、架构图如上图:採用无中心节点的全对称架构,无单点故障,存储容量和性能可线性扩展;新增节点通过简单配置可自己主动添?(IP:PORT),数据自己主动实...
分类:
其他好文 时间:
2014-08-12 21:34:04
阅读次数:
229
摘要 结构型数据,用超大尺寸设计的,以PB级的数据量穿梭在成千上万的商业服务器上面。BigTable正是针对于管理这种结构型数据而设计的。Google的许多大型项目都用到了这种BigTable,包括Web indexing(网络索引),Google earth(谷歌地球),Google fin...
分类:
其他好文 时间:
2014-08-05 00:00:18
阅读次数:
430
Hadoop2/cdh4集群安装CDH是Cloudera完全开源的Hadoop分布式系统架构,为了满足企业的需求而特别构建的系统。即一个开源的企业级分布式存储系统。全称:ClouderaHadoop。它是在ApacheHadoop基础上打入了很多patch。使之性能更好,更加满足生产环境。Hadoop介绍Hadoop是apache的..
分类:
其他好文 时间:
2014-08-02 07:45:03
阅读次数:
366
TokyoCabinet是一款DBM数据库,该数据库读写非常快,哈希模式写入100万条数据只需0.643秒,读取100万条数据只需0.773秒,是BerkeleyDB等DBM的几倍。利用TokyoTyrant构建兼容Memcached协议、支持故障转移、高并发的分布式key-value持久存储系统。key-value分布式存储系统查询速..
分类:
其他好文 时间:
2014-07-31 21:18:47
阅读次数:
197
本文主要针对对HBase不了解的人。主要想基于个人的理解回答以下几个问题:
什么是HBase?何时用HBase?与Hive、Pig的区别?HBase的结构为何HBase速度很快?HBase常用的操作有哪些?HBase的一些配置和监控
什么是HBase?
HBase,是Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。使用HBase技术可以在廉...
分类:
其他好文 时间:
2014-07-31 16:59:07
阅读次数:
271
Sheepdog,是由NTT的3名日本研究员开发的开源项目,主要用来为虚拟机提供块设备。其架构例如以下:以下,我们将从架构、模块等几个方面来介绍下:一、架构图如上图:採用无中心节点的全对称架构,无单点故障,存储容量和性能可线性扩展;新增节点通过简单配置可自己主动添?(IP:PORT),数据自己主动实...
分类:
其他好文 时间:
2014-07-27 23:11:39
阅读次数:
215
006年的OSDI有两篇google的论文,分别是BigTable和Chubby。Chubby是一个分布式锁服务,基于Paxos算法;BigTable是一个用于管理结构化数据的分布式存储系统,构建在GFS、Chubby、SSTable等google技术之上。相当多的google应用使用了BigTab...
分类:
其他好文 时间:
2014-07-26 09:54:57
阅读次数:
376
##分布式存储中的应用 --- 在分布式存储系统中,将数据分布至多个节点的方式之一是使用哈希算法。假设初始节点数为 N,则传统的对 N 取模的映射方式存在一个问题在于:当节点增删,即 N 值变化时,整个**哈希表*...
分类:
其他好文 时间:
2014-07-22 08:22:37
阅读次数:
155
《大规模分布式存储系统:原理解析与架构实战》读书笔记:之前研究了Bitcask存储模型,今天来看看LSM存储模型,两者虽然同属于基于键值的日志型存储模型。但是Bitcask使用哈希表建立索引,而LSM使用跳跃表建立索引。这一差别导致了两个存储系统的构造出现明显的分化。为此,我还先去捣腾了一番跳跃表的实现.今天算是进入了正题。...
分类:
其他好文 时间:
2014-07-21 13:37:46
阅读次数:
296