码迷,mamicode.com
首页 > 其他好文 > 详细

Aerospike-Architecture系列之数据模型(Data Model)

时间:2015-04-20 17:09:52      阅读:305      评论:0      收藏:0      [点我收藏+]

标签:分布式   aerospike   nosql   内存数据库   shard-nothing   

Data Model(数据模型)

Aerospike采用无模式(schema-less)数据模型,这意味着存储在库中的数据不符合严格模式。

这提供了你在Aerospike中存储数据的灵活性-数据修改不需要修改schema,库中已存在的数据也不需要符合指定的schema

Aerospike的无模式(schema-less)数据模型允许动态添加新类型的bin。尽管如此,仍然需要遵守bin名称与数据的对应关系。应用程序必须利用bin的一致性来保障查询和聚合的正确性。

How Data is Organized(数据如何组织)

技术分享
Storage architecture

Namespaces(命名空间)

命名空间(namespace)是数据最顶层的容器。就像在标准的RDBMS中一样,namespace可以是数据库的一部分也可以是一组数据库,这决定于你如何存储和管理namespace中的数据。

一个namespace包含记录(records),索引(indexes )及策略(policies)。策略决定namespace的行为,包括:

  • 数据如何存储:存储于内存或是磁盘
  • 一条记录存在多少个副本
  • 记录何时过期

更多关于namespace配置的信息请参看Configuring Namespaces

根据应用程序的需要,一个数据库可能包含多个不同策略的多个namespace。namespace被认为是一个物理容器,因为其中的数据必须绑定存储设备,存储设备可能是内存、磁盘或者是文件。

图1中,我们定义了两个namespace分别命名为ns1和 ns2。ns1将记录存放在磁盘上,ns2将记录存放在内存中。

技术分享

图1
定义两个namespace,它们使用不同的存储引擎

Sets(集合)

在命名空间(namespace)中,记录可以属于一个称作集合(set)的逻辑容器。集合(set)为应用程序提供了收集记录组的能力。集合(set)继承了包含它的namespace的策略,也可为set指定其他的策略。

图2中,为ns1 namespace添加两个集合,people和places。用于存储基于类型的记录。除了存储于两个集合中的记录,namespace中有部分记录不属于任何set。

技术分享
图2
namspace ns1中定义两个set,People和Place。ns1中也包含不属于任何set的记录

Records(记录)

Aerospike数据库是行存储的所以焦点是独立的记录(在标准RDBMS中称作行)。记录是数据库存储的基本单元。行属于某个namespace或者某个namespace中的set。记录通过namespace中定义的唯一key来访问。

记录的组成如下:



组成 描述
key 记录是通过一个哈希键进行访问的,称作摘要
metadata 元数据提供记录的版本信息(代)以及活动时间(ttl)
bins (fields) bin相当于传统数据中的字段

Key / Digest

应用程序中,每一条记录都有一个用来访问它的key。应用程序通过key来读写记录。

当key被发送至数据库,key(与set信息一起)被哈希化成一个160位的摘要。数据库中,摘要为所有操作定位记录。

key主要用于应用程序访问,而摘要主要用于数据库定位记录。

key可能是整型,字符串或者二进制。细节请参阅Data Types.

Metadata(元数据)

每条记录与描述它自身的元数据一块存储,包括下列事物:

  • generation(代)反映记录被修改的次数。这个数字在应用程序读的时候交回,用来确定正在写入的数据从最后一次读开始未被修改过。

  • 存活时间 (TTL) 用来指定记录生存多长时间。Aerospike会自动依据记录的TTL使其过期。每次在对象上执行写操作TTL就会增加

Bins

在记录(record)中数据被存储于一个或多个bin。一个bin有名字和值组成。bin不指定类型,类型由bin中包含的值定义。

动态类型为数据模型提供了很大的弹性。例如,一条记录中包含值为字符串"bob"名称为 "id"的bin。bin的值可以变成不同的字符串值,也可以变为其他类型的值,比如整型的72.

namespace或set中的记录可能由迥然不同的bin的集合组成。记录无模式,所以每条记录拥有完全不同的bins是有可能的。在记录的生命周期中的任何时点都可以添加或移除bin

在一个namespace钟bin名称的数量是有限制的。最多32k个唯一bin名称。

bin的值可能是任意原生支持的类型(native supported typesLDTs.


原文链接: <http://www.aerospike.com/docs/architecture/data-model.html>
译    者:北京IT爷们儿

 

Aerospike-Architecture系列之数据模型(Data Model)

标签:分布式   aerospike   nosql   内存数据库   shard-nothing   

原文地址:http://blog.csdn.net/jiashiwen/article/details/45150187

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!