第八课——跳跃表、对象

时间：2016-10-03 12:50:56 阅读：279 评论：0 收藏：0 [点我收藏+]

标签：

第八课时作业

静哥

by 2016.4.11~2016.4.17

【作业描述】

1.总结redis在节省内存开销方面做过哪些设计

2.总结概括五种对象的关键点

【作业-1：总结redis在节省内存开销方面做过哪些设计】

关于跳跃表

（1）跳跃表是一种有序数据结构，查询效率和平衡树媲美，实现上比平衡树简单，可以用跳跃表代替平衡树；查找复杂度平均是O(logN)z,最坏是O(N);

（2）跳跃表在redis里只有2个地方使用：一个是实现有序集合键（sorted set）、一个是集群节点中用作内部数据结构；也就是说，跳跃表是sorted set类型的底层实现之一；

（3）每个节点都有层高，层高越高，查找效率越高；存储节点的时候，随机生成1-32之间的随机数，假设生成的层高随机数为N，则，该节点数值在第一层~第N层都会被插入，且每层的数据都是有序的，这样在查找该节点时从最高层依次查找，最高层查不到，接着查次高层；

（4）同节点的层次直接通过数组实现，不是通过链表技术分享

关于整数集合

整数集合（intset）就是将所有整数类型封装到intset这个结构体里，根据实际存储的数据长度来动态选择使用哪种数据类型；

（1）整数类型有int16_t int32_t int64_t等；分别表示的整数范围如下：

技术分享

（2）整数集合（intset）将所有整数类型封装的目的是：减少内存使用。可以根据存入的整数数值大小，动态选择用int16_t类型的还是int32_t类型的等；

技术分享

当设置一个集合后，会判断集合里元素的整数值大小，最大的元素是什么类型的整数，就会将intset设置为该类型；例如一个集合里最大的元素是50000，那么这个集合的数据类型就是int32_t类型的，其他元素值也将被设置为int32_t类型；一个集合里最大的元素是30000，那么这个结婚的数据类型就是in16_t类型的；

例如：新增一个元素，该元素长度超过原来的类型范围，就需要类型升级，例如从int16_t升级到int32_t;

关于对象

（1）Redis里说的SDS字符串、链表、字典。压缩列表、整数集合等都是数据结构，redis并没有直接使用数据结构来实现键值对数据库，而是创建了一个对象系统，这个系统包含字符串对象、列表对象、哈希对象、集合对象、有序集合对象这5种类型的对象；通过不同类型的对象来判断一个对象是否可以执行给定的命令。

（2）redis的对象系统还实现基于引用计数技术的内存回收机制：有个引用计数参数，通过识别这个参数判断对象是否被使用，没有被引用则是否该对象的内存；此外，还实现了对象共享机制，一定条件下，可以多个数据库共享一个对象来节约内存；

（3）redis的5种数据类型，都是通过redisObject结构体来实现的，通过对该结构体的引用，根据实际使用生成5种数据类型的对象；结构体如下：

技术分享

（3.1）Type属性表示类型，type:4的意思是定义属性type，占4个比特，unsigned等同于unsigned int;

（3.2）Encoding属性也占4个比特位；lru属性占24个比特位；

也就是type属性、encoding属性、lru属性合在一起，占用32个比特，也就是4个字节；

（3.3）Refcount属性，是int类型，占4个字节；ptr属性也占用4个字节；

综上，redisObject结构体一共占用12个字节，也就是redisObject结构体，巧妙运用位字段，节省内存，同时相对直接操纵位来编程也更容易。

（3.4）Type属性对应的值有5种，也就是5种对象类型：REDIS_STRING/REDSI_LIST/REDIS_HASH/REDIS_SET/REDIS_ZSET

技术分享

（3.5）Encoding属性表示编码类型：5种对象类型，对应不同的编码类型，会有不同的底层实现；即，编码不同，底层支撑的数据结构不同；

技术分享

Redis在减少内存开销方面做的设计：（1）整数集合；（2）定义redisObject一个结构体，来实现5种数据类型的引用，也即是5种对象；redisObject结构体里，定义type属性区分5种数据类型，多种底层存储结构支撑；而且，redisObject结构体里的type属性、encoding属性、lru属性是用位字段定义的，巧妙运用位字段，节省内存；

【作业-2：总结概括五种对象的关键点】

字符串对象
字符串对象有3种类型实现：int类型、raw类型、embstr类型；
Int,如果一个字符串对象保存的是整数值，并且这个整数值可以用long类型表示；
raw,如果保存的是字符串，且长度大于39字节；
embstr，如果保存的是字符串，且长度小于等于39字节；（embstr与raw一样，使用sds简单动态字符串结构；和redisObject结构一起分片和回收，因此只需要分配或回收一次；embstr的内存回收更快，因为redisObject和sdshdr内存是连续的；）