周末早上,一个哥们突然@我,问是否有线上故障处理和定级的规范或者模板,虽然手头有既有文档,但内容显的太具象了,跟我们的业务有很强的关联性,并不是那么好直接复制到他的团队中。因此,个人对过去的线上故障处理进行了回顾和思考,并进行了简要的归纳,望帮助到需要的同学。文本将按 事中处理、事后总结和事前预防 ...
分类:
其他好文 时间:
2018-11-11 12:13:07
阅读次数:
195
教材学习内容总结 异常控制流 异常 异常类别: 中断 陷阱 故障 终止 中断处理: 陷阱处理: 故障处理: 终止处理: 进程 上周考试错题总结 错题1: read(fd, buf, 30)执行成功,返回可能不是30的是() A . 读时遇到EOF B . 从终端读文本 C . 读磁盘文件,但没遇到E ...
分类:
其他好文 时间:
2018-11-11 00:59:36
阅读次数:
189
关于Polly Polly是一个基于.NET的弹性及瞬态故障处理库,允许开发人员以顺畅及线程安全的方式执行重试(Retry)、断路(Circuit Breaker)、超时(Timeout)、 隔离(Bulkhead Isolation)和回退策略(Fallback ).Polly适用于 .NET 4 ...
目的:分享一下公司的db故障处理流程,主要是思想。事件描述及影响:2018年9月30日04:43点,zabbix告警odsdb2数据库疑似宕机,机房值班人员通过堡垒机无法登录数据库服务器,从其他机器也无法ssh登录该机器,同时odsdb1数据库也HANG住,通过命令无法登录数据库。根据数据库业务流程图初步分析影响的各业务。(涉及公司业务可忽略)事件排查:4:46,机房值班人员通知DBA及亦庄值班人
分类:
数据库 时间:
2018-10-01 23:11:24
阅读次数:
281
环境 centos 6.5 x64 83599ES 万兆网卡 旁路流量送到万兆网卡 升级万兆网卡驱动 重复过一万次的操作,一键搞定;这里有一个小细节,intel官网驱动有版本升级,之前的地址不能用了,重新更改地址,下载最新版的pf_ring 问题 可以看到网卡流量,但是使用tcpdump无法捕获数据 ...
分类:
其他好文 时间:
2018-09-23 00:18:48
阅读次数:
531
ping丢包故障处理方法1、Ping丢包故障定位思路故障分析Ping丢包是指Ping报文在网络中传输,由于各种原因(如线路过长、网络拥塞等)而产生部分Ping报文丢弃的现象。在使用Ping命令,出现Ping丢包的现象时,第一步需要确定Ping丢包的网络位置,其次是确定Ping丢包的故障原因,然后依据定位的故障原因再进行解决。确认Ping丢包的网络位置时一般采用逐段Ping的方法,可以将Ping丢包
分类:
其他好文 时间:
2018-09-12 23:53:51
阅读次数:
196
ES集群修改index副本数,报错:indexread-only/allowdelete(api)原因:es集群数据量增速过快,导致个别esnode节点磁盘使用率在%80以上,接近%90,由于ES新节点的数据目录data存储空间不足,导致从master主节点接收同步数据的时候失败,此时ES集群为了保护数据,会自动把索引分片index置为只读read-only.故障处理办法:1:集群加节点,简单粗暴
分类:
其他好文 时间:
2018-08-25 11:31:18
阅读次数:
177
Linux常用知识及故障处理1、修改当前系统语言比如当前语言是en_US.UTF-8,因环境需要修改为zh_CN.UTF-8,首先切换到root,追加一行内容即可。echo‘exportLANG="zh_CN.UTF-8"‘>>~/.bashrc重新登录系统,查看语言变化echo$LANG2、Linux系统中根目录下或者新挂载的磁盘目录下有一个叫lost+found,它的作用是什么?如
分类:
系统相关 时间:
2018-08-23 20:10:04
阅读次数:
228
ORA-30013: undo tablespace currently in use;12c数据库
分类:
其他好文 时间:
2018-08-23 19:26:16
阅读次数:
207