码迷,mamicode.com
首页 > 其他好文 > 详细

记录一道有趣的数据存取,以及攻击行为判断的题目

时间:2019-06-22 01:24:39      阅读:150      评论:0      收藏:0      [点我收藏+]

标签:redis   有趣   目录   目的   需要   实现   数据量   计数   应该   

题目

三元组(IP1, IP2, T) 描述了行为: 在T时刻,IP1对IP2进行了访问行为;其中将IP1称为源地址,IP2称为目的地址;地址为IPV4格式,如192.168.0.1 10.10.101.10 时间T为字符串格式,例如2019-06-21 23:02:31

现在有一批数据(总数据量为100亿条),期中每一条数据描述了一次访问行为

问题

  1. 请设计一中存储方式,实现数据的存储,并大致描述存储所需要的磁盘空间大小
  2. 若在一定时间X(单位:秒)内,IP1对IP2的访问行为次数超过了N,则称IP1对IP2发生了攻击行为

解答问题一

ip一个int存,时间unix时间long存
这样一个数据是16个字节
100亿数据 就是 1016 10亿 = 160GB

解答问题二

开一个大一些的缓存
用lru,新加入的ip计数为0,已经访问过就加一
这样短时间访问的应该,内存够大的话,是可以把访问频率高的,拦截到的吧?

然后一个头条小姐姐这么回答

redis:计数:key可以构造为ip1toip2的字符串,value是一个list列表,里面存放时间戳,每次都从尾部插入。如果list长度超过n就发生了攻击(判断列表头部的时间戳是否已经在当前时间–x之前了,是的话弹出lpop)在代码端ip1->ip2的时候,rpush ip1toip2

返回解答问题一

存储的话,可不可以做成和文件目录那样,分成二级目录,第二级目录里面存时间戳

记录一道有趣的数据存取,以及攻击行为判断的题目

标签:redis   有趣   目录   目的   需要   实现   数据量   计数   应该   

原文地址:https://www.cnblogs.com/Draymonder/p/11067316.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!