这个事情的背景是公司的Hadoop生态集群都是原生的,不是基于CDH的,所以基本所有的东西都需要自己手动管理,比如集群修改一些属性,然后批量分发重启或者动态生效之类的。这次也算不上事故,因为没对生产环境造成什么影响,但是差一点就变成事故,写出来分享一下。 事情简单概括就是,60+台hadoop的集群 ...
分类:
其他好文 时间:
2020-07-14 13:10:45
阅读次数:
72
RAKsmart可以了解一下,美国知名服务器租用商,多机房可供选择、多线路接入,不限流量,国内访问速度非常快。 一、整体稳定性能较高 RAKsmart机房都是采用最新硬件配置,基本不会出现因为硬件老化而出现宕机事故。另一方面,RAKsmart主机商也会采取多种安全措施来保障服务器稳定运行,可以保证99.9%以上稳定运行。 二、防御体系能力高 RAKsmart美国加州服务
分类:
Web程序 时间:
2020-07-08 19:35:36
阅读次数:
82
ITIL学习-知识管理和服务级别管理ITIL学习-变更管理和配置管理ITIL学习-问题管理和访问管理ITIL学习-事故管理ITIL学习-运营、技术、应用管理和技术管理ITIL学习-作用、原则、生命周期为啥要用itilit是为了业务而服务的,比如换一个操作系统,技术人员认为直接操作就得了,但是从管理角度看,我们应该什么时候操作,做之前需不需要评审,谁来评审,需要做什么检查,需不需要通知一些人。配置管
分类:
其他好文 时间:
2020-06-28 18:54:20
阅读次数:
61
尽管有些企业从未经历过严重的服务器宕机事故,但是投资购买监控工具来检测服务器状态仍然是很明智之举。这样便可以防患于未然,让业务失控之前,进行及时预防和控制。许多企业可能考虑将免费的开源工具作为经济有效的首选方案。但是,这些免费工具需要更深入的技术知识做基础,而且通过手动配置和及时更新才能有效地应用。同时,其缺乏详尽可靠的报表,例如根本原因分析(RCA)和即时告警功能,也不包括相应的用户管理功能。所
分类:
其他好文 时间:
2020-06-28 18:37:26
阅读次数:
61
1.事故背景 在APP访问服务器接口时需要从redis中获取token进行校验,服务器上线后发现一开始可以正常访问,但只要短时间内请求量增长服务则无法响应 2.排查流程 (1)使用top指令查看CPU资源占用还远远达不到瓶颈,排查因为CPU资源不足导致服务不可用的可能 (2)查看tomcat线程池配 ...
分类:
编程语言 时间:
2020-06-28 18:07:18
阅读次数:
75
前言 从电商转金融 2 年多了,由于两者商业模式,流量的不同,期间踩了很多坑,尤其是在监控这一块,我们吃过不少苦头,前期由于监控缺失,造成了多起线上事故,经过一番摸索,我们实现了一些相对可行的监控方法,有效地保证了大盘及业务的稳定,在此总结出来分享给大家,希望能为大家提供一些金融场景下的监控思路,如 ...
分类:
其他好文 时间:
2020-06-28 13:26:46
阅读次数:
118
混沌工程简介 混沌工程师一门新兴的技术学科,它的初衷是通过实验性的方法,让人们建立复杂分布式系统能够在生产中抵御事件能力的信息。 —— Principles of Chaos Engineering 有没有这种感觉,当你写下第一行代码的时候,后面等着你的就是不断和系统中的各种错误做斗争?年纪大了,老 ...
分类:
其他好文 时间:
2020-06-24 19:47:26
阅读次数:
67
随着工业4.0的不断普及与发展,以及国民经济的飞速前进,我国的城市集中供热规模也不断扩大,科学的管理热力管网具有非常重大的经济和社会效益。目前热力系统,如换热站大都采用人工监控,人工监控不仅浪费人力;而且在出现事故隐患时操作人员难以发现,易造成设备事故。同时各换热站比较分散的独立运行,难以达到供热系... ...
分类:
Web程序 时间:
2020-06-23 22:55:20
阅读次数:
171
一、智慧消防的定义 智慧消防的定义在持续的转变,首先我们要面向新需求,新需求主要是火灾事故防治“自动化”、稽查工作“规范化”、灭火救援指挥“智能化”、部队管理“精细化”。大家的着力点是啥,就是要有新技术应用。不能仅用传统式的技术,更多的得用新技术。新技术应用关键有物联网、云计算技术、互联网大数据、移 ...
分类:
其他好文 时间:
2020-06-23 12:59:59
阅读次数:
126
假设我们有一段程序,从 Redis 中读取数据,解析以后提取出里面的 name 字段: import json import redis client = redis.Redis() def read(): while True: data = client.lpop('info') if data ...
分类:
编程语言 时间:
2020-06-22 22:57:03
阅读次数:
55