文件加载至sqlite3数据库,单线程 单核或多核机器,某个cpu都会被压满。 排查过程: perf top -p 【PID】 -g --实时查看当前系统进程函数占用率情况 cpu 全消耗在strlen了 pstack (没有pstack命令的化,安装gdb就成,yum -y install gdb ...
分类:
系统相关 时间:
2020-05-19 15:04:51
阅读次数:
84
故事背景 嘀~嘀~嘀~,生产事故,内存泄漏! 昨天下午,突然收到运维的消息,分部某系统生产环境内存泄漏了,帮忙排查一下。 排查过程 第一步,要日志 分部给到的异常日志大概是这样(鉴于公司规定禁止截图禁止拍照禁止外传任何信息,下面是我网上找到一张类似的报错): 这一看,不得了了,ByteBuf没有释放 ...
分类:
Web程序 时间:
2020-05-19 12:47:51
阅读次数:
61
先说结论:项目遇到的主要瓶颈在CPU和uwsgi的listen参数。下面以时间顺序记录排查过程。 背景 导师安排的一个项目。由于需要使用一些百度智能云的服务,服务器我选的百度BCC,预设的部署方案是两台4核4G应用服务器(uwsgi+falsk)、三台2核8G的数据服务器(Redis+MongoDB ...
分类:
其他好文 时间:
2020-05-09 19:22:09
阅读次数:
83
ora-12592 :包错误 排查过程和解决办法 ORA-12154:TNS:无法解析指定的连接标识符 其他解答 linux服务器要用服务器本地的连接名 ora-12505报错解决方法(转) ora-01489 字符串连接的结果过长 解决方案 oracle查看被锁的表及解除锁 ...
分类:
数据库 时间:
2020-04-29 14:55:04
阅读次数:
68
问题描述: 接到用户反馈,远程连接linux服务器发生故障,具体情况是,当使用xshell远程连接该服务器时,一直卡在连接界面上,直到超时,不能进入到服务器内部,截图如下。 排查过程: 1.接到问题的第一反应是可能是ssh服务有问题,准备登录到服务器内部,但是也出现了上面的情况,等待事件过长,就想着 ...
分类:
系统相关 时间:
2020-04-28 13:19:58
阅读次数:
71
问题描述 ASP.NETMVC项目,编辑页面赋值操作,ajax请求很慢。 对同一个控制器有2个请求 一个为获取该表的树形结构数据(绑定下拉框) 一个为获取某实体的单条记录(编辑操作) 排查过程 数据库 该页面的表只有12个字段,且数据也只有98条, 直接在数据库中执行查询语句也很快,一般在0.03s ...
分类:
Web程序 时间:
2020-04-27 09:40:35
阅读次数:
61
背景 在服务的缓存中使用了redis作为分布式缓存,在使用的过程中发现通过对比发现了一个异常现象:即redis proxy 的CPU使用率和请求的QPS不符合。和基础设施inf的同事也沟通过后,也没有一个固定的结论(也可能inf同事没有很认真的关注这个问题) 排查过程 现象发现 一次偶然的过程中,发 ...
分类:
其他好文 时间:
2020-04-26 16:56:30
阅读次数:
95
线上系统为何经常出错?数据库为何屡遭黑手?业务调用为何频频失败?连环异常堆栈案,究竟是哪次调用所为?数百台服务器意外雪崩背后又隐藏着什么?是软件的扭曲还是硬件的沦丧?走进科学带你了解 Arthas,一款开源一年多 GitHub Star 2 万,99% 的阿里研发小哥都在用的 Java 终极诊断利器!
分类:
其他好文 时间:
2020-04-04 00:16:43
阅读次数:
154
1 背景 周一回来发现用户中心批量更新手机号未生效,上 Nexus 看了下有没有人动了 lib datasource(基础架构组的一个组件,简化连接池装配),最新一个版本在上周四,该版本解决了 AutoCommit 的问题,详见参考1。 2 排查过程 1. 打断点,确认手机号在批量插入前已经脱敏。 ...
分类:
数据库 时间:
2020-03-30 21:39:06
阅读次数:
100
最近做性能测试时,发现连接第三方系统时会有约1%的交易提示如下错误 起先抱着能google就google的思路去找,结果没找到相应的解决方案,只能自己一步一步去排查了,下面记录下排查过程。 抓拍问题现场 涉及到网络的问题,先抓个包,tcpdump走一波。 节选了一次TCP连接的整个内容,从三次握手到 ...
分类:
其他好文 时间:
2020-03-22 19:29:09
阅读次数:
158