码迷,mamicode.com
首页 >  
搜索关键字:事故    ( 808个结果
记一次HDFS配置被覆盖的修复步骤
这个事情的背景是公司的Hadoop生态集群都是原生的,不是基于CDH的,所以基本所有的东西都需要自己手动管理,比如集群修改一些属性,然后批量分发重启或者动态生效之类的。这次也算不上事故,因为没对生产环境造成什么影响,但是差一点就变成事故,写出来分享一下。 事情简单概括就是,60+台hadoop的集群 ...
分类:其他好文   时间:2020-07-14 13:10:45    阅读次数:72
搭建网站用什么服务器?
RAKsmart可以了解一下,美国知名服务器租用商,多机房可供选择、多线路接入,不限流量,国内访问速度非常快。    一、整体稳定性能较高    RAKsmart机房都是采用最新硬件配置,基本不会出现因为硬件老化而出现宕机事故。另一方面,RAKsmart主机商也会采取多种安全措施来保障服务器稳定运行,可以保证99.9%以上稳定运行。    二、防御体系能力高    RAKsmart美国加州服务
分类:Web程序   时间:2020-07-08 19:35:36    阅读次数:82
ITIL学习-作用、原则、生命周期
ITIL学习-知识管理和服务级别管理ITIL学习-变更管理和配置管理ITIL学习-问题管理和访问管理ITIL学习-事故管理ITIL学习-运营、技术、应用管理和技术管理ITIL学习-作用、原则、生命周期为啥要用itilit是为了业务而服务的,比如换一个操作系统,技术人员认为直接操作就得了,但是从管理角度看,我们应该什么时候操作,做之前需不需要评审,谁来评审,需要做什么检查,需不需要通知一些人。配置管
分类:其他好文   时间:2020-06-28 18:54:20    阅读次数:61
服务器监控对您的业务至关重要吗?
尽管有些企业从未经历过严重的服务器宕机事故,但是投资购买监控工具来检测服务器状态仍然是很明智之举。这样便可以防患于未然,让业务失控之前,进行及时预防和控制。许多企业可能考虑将免费的开源工具作为经济有效的首选方案。但是,这些免费工具需要更深入的技术知识做基础,而且通过手动配置和及时更新才能有效地应用。同时,其缺乏详尽可靠的报表,例如根本原因分析(RCA)和即时告警功能,也不包括相应的用户管理功能。所
分类:其他好文   时间:2020-06-28 18:37:26    阅读次数:61
Spring Redis开启事务支持错误用法导致服务不可用
1.事故背景 在APP访问服务器接口时需要从redis中获取token进行校验,服务器上线后发现一开始可以正常访问,但只要短时间内请求量增长服务则无法响应 2.排查流程 (1)使用top指令查看CPU资源占用还远远达不到瓶颈,排查因为CPU资源不足导致服务不可用的可能 (2)查看tomcat线程池配 ...
分类:编程语言   时间:2020-06-28 18:07:18    阅读次数:75
金融监控实战
前言 从电商转金融 2 年多了,由于两者商业模式,流量的不同,期间踩了很多坑,尤其是在监控这一块,我们吃过不少苦头,前期由于监控缺失,造成了多起线上事故,经过一番摸索,我们实现了一些相对可行的监控方法,有效地保证了大盘及业务的稳定,在此总结出来分享给大家,希望能为大家提供一些金融场景下的监控思路,如 ...
分类:其他好文   时间:2020-06-28 13:26:46    阅读次数:118
奈学教育:“混沌工程”的基本理念和使用原则
混沌工程简介 混沌工程师一门新兴的技术学科,它的初衷是通过实验性的方法,让人们建立复杂分布式系统能够在生产中抵御事件能力的信息。 —— Principles of Chaos Engineering 有没有这种感觉,当你写下第一行代码的时候,后面等着你的就是不断和系统中的各种错误做斗争?年纪大了,老 ...
分类:其他好文   时间:2020-06-24 19:47:26    阅读次数:67
工业4.0:换热站最酷设计—— Web SCADA 工业组态软件界面
随着工业4.0的不断普及与发展,以及国民经济的飞速前进,我国的城市集中供热规模也不断扩大,科学的管理热力管网具有非常重大的经济和社会效益。目前热力系统,如换热站大都采用人工监控,人工监控不仅浪费人力;而且在出现事故隐患时操作人员难以发现,易造成设备事故。同时各换热站比较分散的独立运行,难以达到供热系... ...
分类:Web程序   时间:2020-06-23 22:55:20    阅读次数:171
智慧消防智能化管理系统综合分析
一、智慧消防的定义 智慧消防的定义在持续的转变,首先我们要面向新需求,新需求主要是火灾事故防治“自动化”、稽查工作“规范化”、灭火救援指挥“智能化”、部队管理“精细化”。大家的着力点是啥,就是要有新技术应用。不能仅用传统式的技术,更多的得用新技术。新技术应用关键有物联网、云计算技术、互联网大数据、移 ...
分类:其他好文   时间:2020-06-23 12:59:59    阅读次数:126
Python 程序报错崩溃后,如何倒回到崩溃的位置?
假设我们有一段程序,从 Redis 中读取数据,解析以后提取出里面的 name 字段: import json import redis client = redis.Redis() def read(): while True: data = client.lpop('info') if data ...
分类:编程语言   时间:2020-06-22 22:57:03    阅读次数:55
808条   上一页 1 2 3 4 5 6 ... 81 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!