背景 在服务的缓存中使用了redis作为分布式缓存,在使用的过程中发现通过对比发现了一个异常现象:即redis proxy 的CPU使用率和请求的QPS不符合。和基础设施inf的同事也沟通过后,也没有一个固定的结论(也可能inf同事没有很认真的关注这个问题) 排查过程 现象发现 一次偶然的过程中,发 ...
分类:
其他好文 时间:
2020-04-26 16:56:30
阅读次数:
95
本文简单介绍了 Arthas IDEA 插件的安装与使用技巧,该插件解放了大家对于 Arthas 使用的一些记忆、机械性的重复工作,欢迎大家试用! ...
分类:
其他好文 时间:
2020-04-22 18:14:38
阅读次数:
81
[TOC] 缓存预热 宕机 服务器启动后迅速宕机 问题排查 1. 请求数量较高 2. 主从之间数据吞吐量较大,数据同步操作频度较高 解决方案 前置准备工作: 1. 日常例行统计数据访问记录,统计访问频度较高的热点数据 2. 利用 LRU 数据删除策略,构建数据留存队列,例如:strom 与 kafk ...
分类:
其他好文 时间:
2020-04-21 09:29:45
阅读次数:
84
《深入浅出 Kubernetes》开放下载 本书作者 罗建龙 (花名 声东 ),阿里云技术专家,有着多年操作系统和图形显卡驱动调试和开发经验。目前专注云原生领域,容器集群和服务网格。本书分为理论篇和实践篇,共汇集了 12 篇技术文章,深入解析了集群控制、集群伸缩原理、镜像拉取等理论,带你实现从基础概 ...
分类:
其他好文 时间:
2020-04-17 20:08:51
阅读次数:
67
前言:Centos7服务器出现网络异常的问题排查步骤:1.确认是否有IP地址2.重启网卡是否成功3.是否有冲突的网络管理工具(network&NetworkManger)4.检查网卡的配置文件是否正常Warning:主要看日志,默认Log存放位置(/var/log/messages)(1)检测是否有IP地址(这里就不上图了,可以看到网卡信息,但是没有IP地址)我们看一下日志Apr810:3
分类:
Web程序 时间:
2020-04-08 13:35:59
阅读次数:
94
在工作中,常遇见乱处理Exception的情况: 要么吞掉异常,不打印任何日志; 要么记录日志时,日志级别不对、或者把重要的出错堆栈信息干掉,在做生产问题排查时,简直让人抓狂。 我这篇博文,也是对记录的一个开源组件,对异常自行K掉,造成我排查耗费了好久的时间--。https://www.cnblog ...
分类:
其他好文 时间:
2020-04-08 09:41:14
阅读次数:
65
面试官:出现了性能问题,该怎么去排查呢? 程序猿:接口响应那么慢,时间都花到哪里去了? 运维喵:为什么你的应用跑着跑着,CPU 就接近 100%? 分享一些真实生产问题排查故事,看看能否涨姿势,能否 get 到其中之「趣」? 另外,为了方便收藏,文末把 Java 程序优化及问题排查套路,整理成了葵花 ...
分类:
编程语言 时间:
2020-04-04 11:57:22
阅读次数:
110
## 缓存不一致问题## 背景会员相关有:- 综合系统 :会员的基础CRUD ,旧系统,慢慢废弃,不再维护。- 会员系统 :从综合系统里拆分出来的,有基础服务,接口服务,数据同步服务,SSO服务等。 每个服务都是单独的应用。两个系统共用同一张表,只是维护的字段不一样。email【邮箱】是我们新版本中... ...
分类:
其他好文 时间:
2020-03-27 00:53:25
阅读次数:
83
最近排查线上问题,遇到几次线上日志从凌晨0点到全天的某一个随机的时刻日志丢失了,如图所示,打开每天的第一个文件不是从0点开始的日志,莫名其妙的丢失一部分日志。 项目是spring-boot项目,日志的组件是log4j2 version=1.5.12.RELEASEgroupId=org.spring ...
分类:
其他好文 时间:
2020-03-23 20:13:08
阅读次数:
102
最近做性能测试时,发现连接第三方系统时会有约1%的交易提示如下错误 起先抱着能google就google的思路去找,结果没找到相应的解决方案,只能自己一步一步去排查了,下面记录下排查过程。 抓拍问题现场 涉及到网络的问题,先抓个包,tcpdump走一波。 节选了一次TCP连接的整个内容,从三次握手到 ...
分类:
其他好文 时间:
2020-03-22 19:29:09
阅读次数:
158