[toc] 一、故障原因 1.1.1 事故原因 1. 今天中午吃饭的时候,突然接到报警信息,web集群中服务节点中有一台web服务器停止了工作,当时不知道是什么原因,后来问了才知道是机房突然断电导致的。 1.1.2 环境模拟图 1. 故障图 2. 报错原因 就是XFS文件系统有损坏,在1664行和9 ...
分类:
其他好文 时间:
2020-05-24 13:22:05
阅读次数:
75
场景重现 使用 执行以下命令进行数据库备份的时候出现异常: 出现如下错误: 事故原因 查看 解决办法 1. 把闪回区的默认大小调大(~~许久之后,问题会再现,治标不治本~~) 2. 使用自定义的备份路径,不用默认的闪回区作为备份目录(~~磁盘再大,许久之后,问题再现~~) 3. 修改策略,定期删除过 ...
分类:
数据库 时间:
2020-01-08 16:04:20
阅读次数:
148
墨菲定律:事情如果有变坏的可能,不管这种可能性有多小,它总会发生。 海恩法则:每一次严重事故的背后,必然有29次轻微事故和300起未遂先兆以及1000起事故隐患。 事故调查“四不放过”原则 事故原因不清楚不放过; 事故责任者和应受教育者没有收到教育不放过; 没有采取防范措施不放过; 事故责任者没有收 ...
分类:
其他好文 时间:
2019-11-12 13:31:17
阅读次数:
100
首先,祝大家新年快乐!应该陆陆续续开始踏上了回家的征程吧! 生产事故 产品上线一段时间之后,技术支持反馈客户现场一个进程总是挂掉或者不干活!最开始不紧不慢的查找问题,后来老大很生气说:生产事故很严重,你们居然不重视!成立了一个应急小组,专门解决此问题,其中包括我! 事故原因 经过2、3天没日没夜的艰 ...
分类:
其他好文 时间:
2019-01-23 17:29:38
阅读次数:
143
后台程序通过Debug都能正常返回数据并封装到Model中。而在前台通过EL表达式取值时却是原样输出,如${cart.num}... 能正常返回数据并通过视图解析器跳转到cart页面,可在cart.jsp中通过EL表达式无法取出。 事故原因: 原来是项目中的web.xml头部声明搞的鬼..... 加 ...
分类:
其他好文 时间:
2017-08-11 10:50:59
阅读次数:
169
由于来源身份不明、越权操作、密码泄露、数据被窃、违规操作等因素都可能会使运营的业务系统面临严重威胁,一旦发生事故,如果不能快速定位事故原因,运维人员往往就会背黑锅。几种常见的背黑锅场景1、由于不明身份利用远程运维通道攻击服务器造成业务系统出现异常但是运维人员..
分类:
其他好文 时间:
2017-06-29 17:52:53
阅读次数:
9770
今日发现故障一枚:公司网络上外网出现卡/慢等现象。据了解,无论在二层还是三层下ping百度都是出现丢包现象。tracert百度发现出了淮安外网之后出现中断现象,故判断为电信运行商问题;拨打客服电话,上门检测,从电信设备上ping百度及其新浪发现现象正常,无丢包现象。故判断..
分类:
其他好文 时间:
2017-03-02 14:06:05
阅读次数:
202
事故原因:服务器硬盘坏了一块,由于不熟悉RAID,把四块硬盘都拔了下来,安装位置混乱,造成RAID出现问题,数据丢失,系统崩溃,平台支撑系统瘫痪当时的处理:由于存在侥幸心理,觉得我可以自己解决,拖延了上报的时间,自己独立对照说明书去安装,开始的时候在弄硬盘RAID的时..
分类:
其他好文 时间:
2016-06-23 14:37:52
阅读次数:
184
事件:下午16点左右,软研自建svn服务器无法访问事故原因:由于搬家,作为权限认证的LDAP服务器(部署在工作机上)被关停回收解决办法:被关停的LDAP服务器只是一台备份机,所以讲相关LDAP认证重新配置到残留的LDAP服务器(云基地地下机房存放)即可作废的LDAP服务器IP:ldap:/..
分类:
其他好文 时间:
2016-04-21 18:51:34
阅读次数:
198