标签:业务 容量 哪些 更新 做了 一个 系统规划 来源 范围
安全生产是我们的底线,随着业务的不断扩大,服务的范围变广,线上的故障和问题开始频发;这些故障给客户和公司带来了不可估量的损失,不仅影响我们在业界的口碑,更会影响客户群对我们的信任.
我们需要思考,别人为什么使用你的服务?如果你的服务故障了,用户有怎样的反响?出现故障了我们如何止损,减少对客户的影响,维护我们的价值?
安全生产会促进我们服务的可用性,最大限度的减少线上事故率;那么我们应该从哪些方面来提高安全生产,而保护我们的客户,保护我们生产的同学呢?大致的方向主要集中在技术
、架构
、系统
、工具
、组织
、机制
、文化
上.
系统规划
,做到架构优化
,架构简化; 把相同功能的系统尽量合并归并(系统改造
), 减少学习系统的成本;容灾建设
)编码质量
)经过一些数据分析,有80%的线上故障是由于变更导致的,所以对变更的管控一定是减少线上重大故障的一个切面;所以我们在线上变更时一定要格外小心和谨慎;
通过上面2个方面(设计、上线)的规范,我们已经能够应对线上的故障及风险了,但是这样的方式方法却没有得到有效的执行和管控,可能兴致高了,我们就执行一下.
所以我们要有安全生产组织
这样的部门或组织来保证这些规范和机制在生产中良好运转, 通过这个组织能够保证我们的技术架构和工具能够真正落地,实实在在通过安全技术的手段来解决线上故障;
有了组织的保证,我们也要从一些点来规范我们的操作:
标签:业务 容量 哪些 更新 做了 一个 系统规划 来源 范围
原文地址:https://www.cnblogs.com/vinsent/p/11221194.html