redis使用基础(四)
——Redis排序与消息通知
(转载请附上本文链接——linhxx)
一、排序
1、命令
SORT key [ALPHA] [DESC] [LIMIT start end],对列表、集合和有序集合进行排序,当加上alpha参数后,则可以按照字典顺序排序,加上desc则倒序排序,加上limit则支持分页。
2、关键参数
by参数:by key:*->val,可以指定排序的标准,可以自己传入一个list,也可以指定某个列进行排序。
get参数:get key:*->val,可以指定sort排序的返回结果,而不是将整个集合进行返回,要多个参数时采用多个get,另外get#会返回元素本身的键值。
store参数:store key2,可以将前面排序的结果保存在另外一个key里面。
3、性能问题
sort的时间复杂度O(n+mlog m),n是待排序的基数,m是排序后的值。另外redis会在排序前用一个空间为n的容器进行存储排序期间的临时数据。
因此,需要注意几个问题:
1)尽可能减少待排序的集合数量,以减少n
2)如果不需要全部结果,则用limit,以减少m
3)如果要排序的结果大,则用store进行存储。
二、消息队列
redis消息队列可以分为两类,生产者和消费者,当生产者产生的数据会放入消息队列中,消费者监测到消息队列内有数据的时候,可以进行后续的处理。
1、命令
redis提供一个命令叫BRPOP,与RPOP的区别在于,当使用命令对key进行操作时,如果key没有值,则会阻塞等待,直到等到有值后取出进行操作。另外,和brpop相似的,也有BLPOP命令。
2、优先级
由于brpop命令可以支持多个键,并且当每个键都有未处理的数据时,会从最左边的键开始处理。例如有两个邮件提醒业务,一个是开通账号的验证,一个是新消息提醒。则如果太多的不采用优先级,新消息提醒的业务会让开通账号的业务阻塞。因为开通账号的时效性要求更高,因此需要将其放在左边。
3、发布订阅模式
发布订阅模式有特殊的命令,发布的命令是PUBLISH channel message,订阅的命令是SUBSCRIBE channel message,不过由于redis的发布命令不会对消息进行持久化,即后面订阅的无法查看到发布者之前发布的消息。
subscribe命令后,会让客户端进入订阅状态,此后只能输入四种命令:subscribe、unsubscribe、psubscribe、punsubscribe,其他命令会报错。
处于订阅状态后,客户端会收到3种类型的回复,每个回复有三个值,第一个值是回复的类型,根据类型不同,二三两个值也不同。消息类型如下:
1)subscribe 表示订阅成功的反馈,此时第二个返回值是订阅的频道名称,第三个值是当前客户端订阅的频道数量。
2)message 表示收到的订阅消息,也是此模式的核心,其第二个值是频道的名称,第三个值是消息的内容。
3)unsubscribe 表示成功取消订阅某个频道,第二个值是取消的频道名称,第三个是剩余的订阅频道数量,如果是0,则此时会取消订阅模式,后面就可以继续输入其他非订阅的命令。
4、批量订阅模式
命令psubscribe,支持blob模式,即类似正则的模式,如psubscribe channel.*,则订阅所有channel开头的频道。
与此相应的,punsubscribe命令支持批量取消订阅。
三、管道
redis和客户端是用tcp进行的连接,因此来回传送消息都要经过网络,来回的总耗时称为消息时延。当执行多个命令时,每条命令需要执行完毕有返回的时候,下一条才会执行。
当需要一起执行时,redis底层的通信对管道提供了支持,当一组命令中每条命令都不依赖于前一条时,可以一起发送请求,一起返回,以减少网络通信的次数。
四、空间消耗
1、复杂度
redis为每种数据类型都提供两种编码方式,例如hash,当元素很多的时候会使用散列表的方式进行存储,时间复杂度仅O(1);但是当元素很少时,O(n)和O(1)差距不大,为了节约内存,redis会采用内部编码方法,用时间换空间。
redis可以使用OBJECT ENCODING key的方式,查看每个键的内部编码类型。
2、编码
redis在内部编码采用结构体类型,如下:
typedef struct redisObject{
unsigned type:4;
unsigned notuse:2;
unsigned encoding:4;
unsigned lru:22;
int refcount;
void *ptr;
}
type代表类型,用数字0-4表示五种类型;notuse是预留空间,未使用;ptr指针指向具体存储的数据;encoding有9种,0-8,包括原生编码、整型、哈希表、zipmap、双向链表、ziplist、skiplist、字符串。针对redis的五种数据类型,分别有不同的encoding方式,如下图所示:(来自网络)
3、字符串优化
字符串存储在一个结构体,包括字符串长度、具体内容、剩余空间。当执行set命令,要占用30字节,而当键值是64位的整数,则ptr指针会直接指向值,而不是指向结构体,可以节约到16字节。
当存储的是0-9999时,redis由于会默认存储这些数字,则ptr指针直接指向引用,占用0字节的空间。
4、散列优化
在配置文件中设置hash-max-ziplist-entries和hash-max-ziplist-value,当散列的键的个数少于entiries值,且每个键值都小于value值,则会使用ziplist的方式编码,否则用哈希表来编码。ziplist牺牲时间换空间,哈希表牺牲空间换时间,因此数据少用ziplist,多的时候用哈希表。
因此,两个参数不宜设置的太大。
5、列表优化
列表和散列相似,有list-max-ziplist-entries和list-max-ziplist-value来配置。编码方式包括ziplist、双向链表、quicklist,quicklist结合ziplist和双向链表的有点,达到减少空间的同时适当减少时间。
6、集合优化
配置文件配置set-max-intset-entries,小于时采用intset编码,否则用哈希表。intset使得集合内部有序排列,便于用二分法进行查找,但是添加和删除则需要进行排序,元素多的时候速度慢。
7、有序集合优化
配置文件配置zset-max-ziplist-entries和zset-max-ziplist-value。包括ziplist和skiplist编码方式,skiplist是使用哈希表和跳跃列表两种结构来存储,哈希表用来存储分数的映射,跳跃列表用来存储分数和元素值的映射。
——written by linhxx
更多最新文章,欢迎关注微信公众号“决胜机器学习”,或扫描右边二维码。