当磁盘大小超过标准时会有报警提示,这时如果掌握df和du命令是非常明智的选择。 df可以查看一级文件夹大小、使用比例、档案系统及其挂入点,但对文件却无能为力。 du可以查看文件及文件夹的大小。 两者配合使用,非常有效。比如用df查看哪个一级目录过大,然后用df查看文件夹或文件的大小,如此便可迅速确定...
分类:
系统相关 时间:
2014-09-06 17:22:13
阅读次数:
272
edwin从发布以来, 得到了不少关注, 获得了不少star. 最近又做了一些很有意义的改进, 同时完善了部分文档. 项目地址: https://github.com/harryliu/edwin , 欢迎fork或PR, 如果喜欢, 请打star. 再次介绍一下edwin项目edwin是一个报警和...
分类:
编程语言 时间:
2014-09-06 02:13:02
阅读次数:
563
万恶的报警总是在凌晨响起,爬起来查询一下了日志。再重启服务器的时间报错bash:fork:retry:资源暂时不可用。等待服务启动成功后执行:ulimit-a
结果是:1024看到结果后进行了修改ulimit-n655356#最大可以打开的文件
ulimit-u65536#最大可以建立的进程数为了使下次重启生效修改..
分类:
其他好文 时间:
2014-09-03 18:22:47
阅读次数:
248
线上遇到的一个case,应用结构是nginx----->resin---java,其中nginx做lb,resin做为java的容器。在nginx层面做httpcode的监控,发现有4xx比例高的的报警:分析nginx日志,发现是由于499比例高导致xxxxxxxx-[29/Oct/2012:04:10:03+0800]"GET/GetConfiguration.jsp?peer_vers..
分类:
数据库 时间:
2014-09-03 02:42:56
阅读次数:
281
前言:python下的celery是啥东西大家应该有了解,是一个异步的任务框架。话说,我以前写过一个报警平台的项目,也需要任务的扩展成分布式,当时总是觉得用celery不是那么太靠谱,所以就自己写了一个分布式的任务派发的系统。今个和朋友聊起了分布式爬虫,这哥们说任务有时候经..
分类:
编程语言 时间:
2014-09-03 02:42:47
阅读次数:
1943
1. 实际问题
初步查看发现,无法对外新建TCP连接时,线上服务器存在大量处于TIME_WAIT状态的TCP连接(最多的一次为单机10w+,其中引起报警的那个模块产生的TIME_WAIT约2w),导致其无法跟下游模块建立新TCP连接。
TIME_WAIT涉及到TCP释放连接过程中的状态迁移,也涉及到具体的socket api对TCP状态的影响,下面开始逐步介绍这...
分类:
其他好文 时间:
2014-09-01 21:13:53
阅读次数:
9542
--今天打开报警日志,看见错误:ORA-19504:failedtocreatefile"+DATA/prod/2_3_856847287.arc"ORA-17502:ksfdcre:4Failedtocreatefile+DATA/prod/2_3_856847287.arcORA-15041:d...
分类:
其他好文 时间:
2014-09-01 15:23:13
阅读次数:
211
sendmail.sh的内容如下:#!/bin/bashto=$1subject=$2body=$3cat <<EOF|mail -s "$subject" "$to"$bodyEOF脚本权限为755的。
分类:
其他好文 时间:
2014-08-30 19:04:39
阅读次数:
238
编程实现RTC还提供的2种时钟中断功能:报警中断和时间节拍中断。...
分类:
其他好文 时间:
2014-08-25 22:56:05
阅读次数:
273