这篇博文分享的是我们针对一个耗时20秒的请求,用Wireshark进行抓包分析的过程。请求的流程是这样的:客户端浏览器 -> SLB(负载均衡) -> ECS(云服务器) -> SLB -> 客户端浏览器。从分析的情况看,SLB与客户端的网络环境都可能引起这个问题。但是从IIS日志来看,有些耗时长的...
分类:
其他好文 时间:
2014-06-19 00:31:12
阅读次数:
779
今天中午12:00左右,在Windows性能监视器中突然发现SLB中的两台云服务器的IIS请求到达量(ArriveRate)突然下降,我们推测在12:00-12:10之间,SLB(阿里云负载均衡)出了什么状况?这个问题有待继续观察。
分类:
其他好文 时间:
2014-06-16 07:51:00
阅读次数:
271
安装说明系统环境:Centos-6.3安装软件:mongodb-linux-x86_64-2.2.2.tgz下载地址:http://www.mongodb.org/downloads安装机器:192.168.15.237上传位置:/usr/local/软件安装位置:/usr/local/mongod...
分类:
数据库 时间:
2014-06-16 06:51:24
阅读次数:
339
超过70秒的请求是通过分析IIS日志发现的,通过Wireshark抓包分析请求是9:22:21收到的。这个请求响应内容的长度是:Content-Length 1154110(1.1MB),云服务器在收到请求后,发了一个ACK包。接下来就是一堆的TCP segment of a reassembled...
分类:
其他好文 时间:
2014-06-15 12:08:40
阅读次数:
527
求监控组的大哥大妹子们干点事,真不容易!要问他们是谁?他们是神。轻易别找他们,因为找了也是白找。上次因为python和redis长时间brpop的时候,会有线程休眠挂起的情况,所有通知报警平台被下线了。这次算是完美解决了。再把他给上线。这两公司的告警已经开始往我这边的接口..
分类:
数据库 时间:
2014-06-13 21:08:17
阅读次数:
414
这是今天遇到的第3次故障,故障是首先被园友发现的,访问园子出现来自SLB的错误提示:400
Bad Request - Powered by
Tengine。查看Windows性能监视器发现,在故障期间SLB中的2台云服务器的http.sys的ArriveRate明显下降。
分类:
其他好文 时间:
2014-06-13 20:29:45
阅读次数:
335
今天下午17:00-17:05之间,在请求量没有明显变化的情况下,SLB中的1台云服务器的CPU突然串到100%(当时SLB中一共有3台云服务器)。造成的直接后果是请求执行时间变得超长,最长竟然达到了53秒。另外伴随的表现是大量请求排队。从这些现象分析,我们猜测CPU
100%那台云服务器出现了CP...
分类:
其他好文 时间:
2014-06-12 10:39:48
阅读次数:
279
“黑色1秒”问题经过一个多月的艰苦奋战,今天终于取得了重要进展!我们终于有了足够的数据证明不是微软IIS的问题,就是阿里云Xen虚拟机的问题。这篇博文分享的是我们如何进行证明的,而且这次证明连Window性能监视器都不需要。下面我们来分析一下今天10:37:35出现的“黑色1秒”
分类:
其他好文 时间:
2014-06-10 16:13:40
阅读次数:
216
17:55-18:20,我们使用的阿里云SLB(负载均衡)中有3台出现突发故障,造成全站无法访问,给您带来了麻烦,请谅解!目前已经恢复正常,从阿里云那得知的故障原因是——由于杭州地区的SLB所在网络控制系统出现异常导致。故障感言:如果淘宝在阿里云上,SLB的网络控制系统敢出现异常吗?
分类:
Web程序 时间:
2014-06-10 00:27:13
阅读次数:
833