前言: 在MySQL运维过程中,锁等待和死锁问题是令各位 DBA 及开发同学非常头痛的事。出现此类问题会造成业务回滚、卡顿等故障,特别是业务繁忙的系统,出现死锁问题后影响会更严重。本篇文章我们一起来学习下什么是锁等待及死锁,出现此类问题又应该如何分析处理呢? 1.了解锁等待与死锁 出现锁等待或死锁的 ...
分类:
数据库 时间:
2021-05-24 02:11:41
阅读次数:
0
1.相关概念解读 1.1 Service 在kubernetes中每个Pod都存在生命周期;当一个Pod出现故障,极有可能被Pod控制器销毁并新建一个同类Pod取代(Pod控制器对Pod进行扩容也会新建Pod)。因此每个新建的Pod的都会重新获取IP,因此可以说通过IP获取Pod的服务是不可靠的。 ...
分类:
其他好文 时间:
2021-05-24 01:03:14
阅读次数:
0
在上一部分,我们学习了 SRE 的基础,需要掌握的重点是 SLI 和 SLO 以及 Error Budget(错误预算)策略。SLI 是我们选择的衡量系统稳定性的指标,SLO 是每个指标对应的目标,而我们又经常把 SLO 转化为错误预算,因为错误预算的形式更加直观。转化后,我们要做的稳定性提升和保障 ...
分类:
其他好文 时间:
2021-05-04 16:21:43
阅读次数:
0
JProfile工具分析OOM 项目中出现OOM故障,该如何排除? 找出第几行代码出错:内存快照分析工具: Eclipse : MAT JProfile MAT、JProfile的作用: 分析Dump内存文件,快速定位内存泄露。 获得堆中的数据。 获得大的对象 ..... 首先在IDEA安装插件JP ...
分类:
其他好文 时间:
2021-05-04 15:34:31
阅读次数:
0
Redis的主从复制模式下,一旦主节点由于故障不能提供服务,需要人工将从节点晋升为主节点,同时还要通知应用方更新主节点地址,对于很多应用场景这种故障处理的方式是无法接受的。可喜的是Redis从 2.8开始正式提供了 Redis Sentinel (哨兵)架构来解决这个问题。 1.基本概念 由于对Re ...
分类:
其他好文 时间:
2021-05-04 15:22:14
阅读次数:
0
今天五一劳动节的一大早 5:50-6:30 期间,我们使用的阿里云 RDS SQL Server 数据库实例再次出现 CPU 100% 问题,引发全站故障,由此给您带来麻烦,请您谅解。 我们发现故障后立即进行主备切换,与上次故障不同的是,这次主备切换没有成功,再次切换,依然没有成功,后来尝试重启实例 ...
分类:
数据库 时间:
2021-05-04 15:18:46
阅读次数:
0
基于内存的Redis应该是目前各种web开发业务中最为常用的key-value数据库了,我们经常在业务中用其存储用户登陆态(Session存储),加速一些热数据的查询(相比较mysql而言,速度有数量级的提升),做简单的消息队列(LPUSH和BRPOP)、订阅发布(PUB/SUB)系统等等。规模比较 ...
分类:
其他好文 时间:
2021-05-03 12:08:07
阅读次数:
0
一、实验背景 canal有一个参数canal.instance.standby.address可以指定源端数据库的从库为备选数据库,当源端master宕机后,canal仍能指向备库进行同步。 但是发现canal 1.1.4不兼容mariadb的gtid: 当canal instance里指定了gti ...
分类:
数据库 时间:
2021-04-28 11:41:01
阅读次数:
0
秒杀,就是在同一个时刻有大量请求争抢购买同一个商品,并完成交易的过程,其间涉及大量的并发读和并发写。 秒杀对于程序员来讲也意味着巨大的挑战。如何让系统面对百万级的请求流量不出故障?如何保证高并发情况下数据的一致性写? 希望带你透彻理解秒杀系统的各个关键技术点,带你了解如何打造一个超大流量并发读写、高 ...
分类:
其他好文 时间:
2021-04-24 13:56:15
阅读次数:
0
VRRP(Virtual Router Redundancy Protocol):虚拟网关冗余协议 工作原理:核心路由器会每隔一段时间(2s)发送特定的VRRP报文,如果在5s没有收到对方发来的VRRP报文,就认为Master设备出现故障,此时的Backup会自动切换为Master 基础配置: AR ...
分类:
其他好文 时间:
2021-04-21 13:01:29
阅读次数:
0