标签:
1.建立正确的系统管理思想 7*24系统运维 { 每周7天每天24小时不间断系统监控 每天8:00~24:00为用户访问时间 每天2:00~6:00为可维护或可中断时间 稳定性监控、配置文件备份、数据库结构 备份可在用户访问时间完成 系统、应用、平台的迁移操作必须在可维 护时间内完成(例如:服务上下线) 线上数据库的任何离线操作均需在可维护 时间内完成(例如:数据库迁移) } 运维工程师要求 { 保证服务达到上线标准,保证上线服务稳定且安全 不断的提升应用服务的可靠性与健壮性, 性能不断优化并保证安全性逐步提高 网站各层面监控(软件、硬件、运行状态等),避免监控死角、并能实时了解应用的运转情况 通过创新思维解决运维效率问题;不断优化自动化脚本,使用新技术不断解决新问题。 积累与沉淀运维知识,不断完善文档,避免重复性范错。 需要计划性和执行力;工作有计划、有具体的实施步骤,计划后想方设法达到目标,不找借口。 能对日常监控工作进行提炼,设计并开发运维工具,利用现有系统或脚本生成可视化统计图 } 如何在工作中避免出错 { 先备份后修改 备份所有,在你毁灭系统前 备份文件带上时间戳和机器名或IP地址 最好异地备份 备份前打包零碎文件 权限(包括拥有者和拥有组)也要备份 别忘了链接文件 把操作步骤写下来,执行前确认一次 目标端和源端各开一个窗口 尽量让不同的主机窗口呈现不同颜色 覆盖文件前三思而后行 mv永远比rm安全 留下操作记录是你对团队的责任和他人继续你工作的保证 } 运维安全考虑 { 保护自己和保护用户同样重要 解读保密协议 不要把客户的数据带离公司 你可以看到所有的数据,但出于职业道德 你不能看,即使看了也要忘掉 将一天的操作记录下来并汇报 小心永远比粗心更利于你的成长 } 日常需要提交的文档 { 日报 周报 月报 操作计划待审报告 项目操作及结果汇报 普遍性问题汇总报告 无法解决问题汇总报告 } 日常时间管理 { 当你需要集中精神的时候,关掉你的QQ和微博,机调到震动或飞行 把任务分类,重要且紧急的事先做,然后是重要的事情 每小时查看一次邮件而不是每分钟 制定自己的时间表,最好是GTD式的 操作前分类业务,通用性操作尽量自动化 推荐阅读--《时间管理—给系统管理员》 } 优秀的系统管理员的能力 { 1. 自发识别系统管理任务能力 2. 实现最佳实践思想能力 ○ 标准化 Standardization ○ 集中化 Centralization ○ 扩展性 Scalability ○ 条理性 Provisioning ○ 自动化 Automation 3. 避免“一次性(OneOff)”陷阱能力 4. 使用系统管理工具能力 } 日常系统管理工作 { 1. 系统启动和关闭 2. 日常所需维护的 ○ 文件系统完整性和空闲磁盘空间 ○ 诸多配置文件 ○ 软件的安装 ○ 用户认证 ○ 安全 ○ 系统监控 ○ 部署新系统 ○ 整合旧系统 } 标准化 { 1. 制定计划 ○ 系统安装和升级 ○ 软件安装和升级 安装任何软件的时候你都应遵循如下顺序: 1) 首先在试验机或测试机上安装测试这个应用的源代码或是二进制方式程序 2) 为第三方软件创建可以在你服务器上安装的服务器系统支持的安装包结构(类 RedHat 的系统使用 RPM 方式,类 Debian 的系统使用 DEB 方式,类 BSD 的系统 多使用 TAR 方式) 3) 在试验机或测试机上测试你打包的应用程序软件安装包 4) 将软件包部署到需要它的系统中去 5) 在部署服务器上核实其运行状况 6) 如有必要可以恢复之前的系统结构和配置 2. 创建标准文档 • 文件系统列表 • 第三方软件列表 注意版本信息 • 配置文件列表 • 你认为所有重要的东西 } 配置文件列表 { who 程序 when 时间 why 为什么修改 what 修改的内容 } 文档规格 { 要求 方案 操作步骤 问题和答案 系统监控 部署系统 整合旧系统 } }
零基础学习云计算及大数据DBA集群架构师【企业级运维技术及实践项目2015年1月21日周四】
标签:
原文地址:http://www.cnblogs.com/bluesunspot/p/5205243.html