研发人员应该以下方面去梳理技术体系。包括工具的使用、技术的更新。 需求分析 分析需求,用合理合适的架构、技术模型去解决需求问题。 开发 架构的搭建,工具的使用,coding管理。 测试 系统测试、安全测试、压力测试。 部署 多机房、负载。 运维 监控、报警、trace跟踪。 ...
分类:
其他好文 时间:
2017-02-04 12:33:31
阅读次数:
286
一、Docker 容器监控报警方式 接着上篇文章的记录,看到grafana的版本已经更新到4.2了,并且在4.0以后的版本中,加入了Alert Notifications 功能,这样在对容器 监控完,可以加入报警规则。根据官网介绍,报警方式也有很多种,常见的Email、Slack即时通讯、webho ...
分类:
其他好文 时间:
2017-01-20 13:09:14
阅读次数:
1462
一、目的目的:zabbix监控本地用户或者mstsc登陆windows服务器,避免密码泄露,恶意登陆,信息泄露现象,及时通报给系统管理员。注意:此文档不探讨zabbix分布式,调优,监控其它服务等问题。本实验做了一天多,比较耗时,走了点弯路,允许转载,请转载请指明链接:renzhiyuan...
一安装安装Apache、Mysql、Php、zabbixsudoapt-getupdate
sudoapt-getinstallapache2mysql-serverlibapache2-mod-php5php5-gdphp5-mysqlphp5-commonzabbix-server-mysqlzabbix-frontend-php二服务端配置2.1配置数据库连接sudovim/etc/zabbix/zabbix_server.conf修改相关DBName=..
分类:
系统相关 时间:
2017-01-04 17:28:40
阅读次数:
349
整理一下今年做的事情: 工作: 1. IM通讯平台 完全基于Erlang重新设计、从头开始编写。主要功能,多终端消息、已读未读、历史记录完全同步,富文本,好友关系,群组、讨论组,二人、多人音视频。实现灵活自动化部署、日志收集分析、监控报警,全用例覆盖自动化测试脚本。 投入了120%的精力。SDK部分 ...
分类:
其他好文 时间:
2017-01-01 07:49:02
阅读次数:
229
自动化运维名声显赫,但是各自理解不同,我也想说一说。首先做事情要目的明确,那么自动化是为了什么?人力?物力?财力?作为公司自然是为了节省这三项,具体到运维上有哪些呢?1、节省安装系统、初始化系统、部署软件、更新版本、更新配置的时间2、集成系统监控、报警、故障..
分类:
其他好文 时间:
2016-12-15 15:06:30
阅读次数:
193
TaoKeeper是一个围绕ZooKeeper做的监控与报表系统。 主要功能如下: 能够统计ZK集群连接数,Watcher数目 ,节点数等系列信息,并按一定规则进行一些聚合操作; 能够通过设置一些阈值来达到监控报警的效果; 能够按天按周进行ZK运行状 况的报表展现; 其中ZK实时运行状态的统计和机器 ...
分类:
其他好文 时间:
2016-11-23 07:06:24
阅读次数:
276
缘由: 接到电话nagios监控报警,api、url访问不ok。 处理后回顾了一下自己的处理流程并延伸了下思绪,以前所处理的游戏问题及网站打不开、打开慢的情况处理、排查的思路、步骤都是相通的。 现将思绪整理下。 PS: > <-- 起初应该就是访问不ok的问题才有的后续步骤 需要确实是个别现象问题, ...
分类:
其他好文 时间:
2016-11-08 08:04:16
阅读次数:
179
项目上线不到一个月,zabbix数据居然快100G,监控项太多,数据量太大,zabbix负载重,暂时不想升级硬件,只好内部挖掘下,清除下历史数据;一般保留1个月的数据,zabbix这个项目只是做监控报警用,数据保留太多没太大参考意义;一般都是这几个表太大,history,history_uint,h..
分类:
其他好文 时间:
2016-10-29 02:28:38
阅读次数:
551
包括以下步骤: 容量规划 架构设计 数据库设计 缓存设计 框架选型 发布方案 数据迁移、同步方案 分库分表方案 回滚方案 高并发解决方案 一致性选型 性能压测方案 监控报警方案 领域模型设计 ...
分类:
其他好文 时间:
2016-09-19 17:36:22
阅读次数:
106