#前言 多年前入职了现在的公司,当时还没有完整的异常测试的体系,后来根据自己的经验结合现状,帮助公司建立了一套异常测试的流程和文档,和另外的同学一起设计了异常故障注入平台,也完成了一些演练的落地,在这里做一些总结。 #kv故障演练 kv即key-value数据库,业界普遍使用的有redis、zook ...
分类:
其他好文 时间:
2020-06-25 17:20:29
阅读次数:
199
本次技术沙龙,将从服务治理、监控、故障演练、无服务器计算等方面来介绍美团在中间件核心领域的技术演进和实践,希望与业界技术同行一起交流学习。 ...
分类:
其他好文 时间:
2019-12-20 18:28:49
阅读次数:
90
1、应用服务启动前不可用 假设eureka server服务在client应用服务启动之前挂掉,或者没有启动,这时应用服务依然可以正常启动,但是会有报错信息: 由于连不上eureka server,自然访问不了service registry的服务注册信息,不能与其它的服务交互。这种情况下,eure ...
分类:
其他好文 时间:
2019-10-13 18:40:43
阅读次数:
392
https://my.oschina.net/u/1464083/blog/3022661 在传统的软件测试中,我们通常通过一个给定的条件来判断系统的反馈,通过断言来判断是否符合预期,测试条件和结果通常比较明确和固定。而混沌工程,是通过注入一些“不确定”因素,象放进了一群淘气的猴子,在系统资源、可用 ...
分类:
Web程序 时间:
2019-07-12 18:54:32
阅读次数:
180
在我日常运维工作中,服务器CPU使用率100%卡死了,现象很常见,那今天咱们就一起模拟故障,进行细致的分析,首先介绍下,CPU出现问题的几种原因:
分类:
其他好文 时间:
2018-06-04 11:23:07
阅读次数:
213
《腾讯刘豪:腾讯内部有 160 多个业务使用微服务架构 》,《铁道部新客票系统设计》,《京东京麦开放平台的高可用架构之路 》 《不同类型业务系统技术架构的差异化 》 《超全总结 | 阿里电商故障治理和故障演练实践》 《从100PV到1亿级PV网站架构演变-知识结构 》《淘宝技术发展历程(一)》 《淘... ...
分类:
其他好文 时间:
2018-01-03 15:49:47
阅读次数:
192
XIITILIT运维管理体系:IT管理中的PPT(people人;process流程;technology技术);标准化(是否有紧急故障处理流程)、工具化;备份解决方案;灾备解决方案;监控解决方案;上线(回滚)流程;测试流程;紧急故障处理流程;DB恢复流程;各种故障演练;服务service:service是..
分类:
其他好文 时间:
2017-07-10 22:22:43
阅读次数:
284
XIITILIT运维管理体系:IT管理中的PPT(people人;process流程;technology技术);标准化(是否有紧急故障处理流程)、工具化;备份解决方案;灾备解决方案;监控解决方案;上线(回滚)流程;测试流程;紧急故障处理流程;DB恢复流程;各种故障演练;服务service:service是..
分类:
其他好文 时间:
2017-01-21 14:15:09
阅读次数:
319