Cassandra基本介绍(2) - Cassandra概述

时间：2016-06-07 16:33:07 阅读：259 评论：0 收藏：0 [点我收藏+]

上一节我们介绍RDBMS遇到的问题，这一节我们将介绍Cassandra以及Cassandra是否可以解决此问题。

通过此章节，我们将学习到：

什么是Cassandra
Cassandra数据的Hash分布
Cassandra在CAP中的权衡
Cassandra复制
Cassandra可调一致性
Cassandra多数据中心

什么是Cassandra

Apache Cassandra是一个开源的、分布式、无中心、弹性可扩展、高可用、容错、一致性可调、面向列的数据库，它基于Amazon Dynamo的分布式设计和Google BigTable的数据库，有Facebook创建。总结特点如下：

分布式与无中心

分布式意味着它可以运行在多台机器上，而呈现给用户是一个整体。无中心意味着Cassandra不会存在单点，也就是说每个节点都是一样的，没有节点会承担特殊的管理任务。与master/slave结构相反，Cassandra的协议是P2P的，并使用gossip来维护存活或死亡节点的列表。

ps：gossip算法又被称为反熵（Anti-Entropy），熵是物理学上的一个概念，代表杂乱无章，而反熵就是在杂乱无章中寻求一致，这充分说明了Gossip的特点：在一个有界网络中，每个节点都随机地与其他节点通信，经过一番杂乱无章的通信，最终所有节点的状态都会达成一致。每个节点可能知道所有其他节点，也可能仅知道几个邻居节点，只要这些节可以通过网络连通，最终他们的状态都是一致的，当然这也是疫情传播的特点。

高可用与容错

从一般架构的角度看，系统的高可用性是由满足请求的能力来度量的。但计算机可能会有各种各样的故障，从硬件故障到网络中断都有可能。所以对于一个需要高可用的系统，它必须由多台联网的计算机构成，并且运行于其上的软件也必须能够在集群条件下工作，有设备能够识别节点故障，并将发生故障的中断的功能，在剩余系统上进行恢复。 Cassandra就是高可用的。可以在不中断系统的情况下替换故障节点，还可以把数据分布到多个数据中心，从而提供更好的本地访问性能，并且在某一数据中心发生火灾等不可抗拒灾难的时候防止系统彻底瘫痪。线性扩展由于Cassandra采用P2P协议，可以很容易的进行水平扩展，而且性能也随之线性增长。ACID支持良好 Cassandra的一致性可调：严格一致性 ~ 最终一致性。同时通过CAS(CompareAndSet)来支持轻量级事务。没有SPOF（ Single point of failure）容易管理操作 Cassandra很容易进行添加、删除、替换节点等操作。