标签:google bigtable 数据库 分布式 数据管理
GFS解决了某些业务场景对分布式文件系统需求,很自然的,也有某些业务仅仅靠文件系统用起来还是不那么方便,它们需要分布式数据库系统。BigTable就是Google为了解决内部对大规模结构化数据处理的需求而产生的。论文摘要涉及的“关键”字为:5. 数据模型
首先,需要注意的是,这里所谓的结构化数据和做DBMS的说的结构化数据不完全是一回事。后者定义的结构化数据都是数值、字符串等确实比较结构化的数据,而且长度也不会很大;采用的数据模型大多指的就是关系模型。其次,数据量大和此前做DBMS的人喜欢说的海量数据库也不是一个数量级。海量只不过是TB,而这里的大怎么着也是PB甚至以上了(这个大概和做OLAP的人说的量级差不多)。既然如此,典型的那些应用显然也超出了传统关系数据库能够摆平的范围了。这里头涉及到的细节比较多,需要慢慢的品味。而一涉及性能优化,就会比较发散到压缩、布隆过滤器等等比较通用的算法/技术。有些东西没有做过,理解得还比较肤浅,留待后面继续学习。。。。。
回顾一下著名的BigTable论文,布布扣,bubuko.com
标签:google bigtable 数据库 分布式 数据管理
原文地址:http://blog.csdn.net/zedware/article/details/35875485