IT监控与运维管理是用户保障业务系统正常稳定运行的必要手段,是用户业务系统的支撑工具。随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题。
本人在IT监控与运维服务管理领域耕耘十五年,从ITIL服务体系到SLA服务等级协议等理念的引入见证了IT运维管理服务领域的成长历程。IT运维管理发展到现今的水平还是存在着诸多的矛盾与问题,伴着IT在企业中的作用日益明显,IT建设和IT运维同时成为了企业效率的加速器。基础架构平台和软件系统的运维已成为了各行各业单位,尤其是信息服务部门普遍头痛的事情。
现状之一:IT运维成本与收益的矛盾
大多数CIO表示最关心的是IT运维成本过高。一方面用户实施建设了很多业务系统,使得IT系统运行越来越复杂,也越来越难管理。同时另一方面IT运维成本过高的主要原因是IT运维的自动化做得还不够好,依靠手工流程来管理,不但使到运维效率不高,而且人力成本更是花费惊人。
如何计算IT运维成本与IT建设规模的关系?如何确定IT运维标准,以至于如何考核IT运维团队的工作绩效都是迫切需要得到解决的问题。
现状之二:“救火式”被动的IT运维管理
在IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:
IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;
IT运维本身质量很难提高;
再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;
IT部门和业务部门对IT运维的服务满意度都不高。
如何改变被动式监控、运维,将可能导致业务中断的事故消灭在萌芽状态也是当前运维管理切实需要解决的问题之一。
现状之三:监控运维孤岛的形成
在企业各个不同业务系统之间由于在功能上不关联互助、信息不共享互换以及信息与业务流程和应用相互脱节,从而形成一个个信息孤岛。同样,在IT监控、运维领域也会发生孤岛效应。
这个问题主要是发生在拥有许多子公司或分支机构的企业、单位,每个分支机构的系统都是独立的。各分支机构都单独建设和维护自己的核心业务系统,都各自配备开发人员和维护人员。
同时在运行维护方面,对故障的解决,完全依靠运行维护部门的工程师的上门服务。不管问题大小,工程师都要来回去现场解决。遇到一些技术难度大的问题,如果工程师的水平高,处理起来就快;如果水平低,甚至花上几个小时,可能也解决不了。
企业无法从整体层面反映IT运维管理的实际水平情况,无法形成统一的运维管理机制,在很大程度上造成了IT运维资源的浪费,直接导致IT运维成本的居高不下。
现状之四:IT运维自动化水平与管理需求的矛盾
尽管目前IT运维管理的技术在不断进步,但实际上很多企业的IT运维人员并没有真正解脱出来,主要原因是IT运维的自动化不高而导致的。监控技术虽然能够获取IT设备、服务器、存储、网络流量以及业务应用系统、数据库等的警告信息,但成千上万条警告信息堆积在一起根本没法判断问题的根源在哪里。
还有,许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。
从中国企业信息化发展进程及企业IT生命周期来看,在IT运维方面,企业将从对基础架构平台、软件系统的简单维护进入到强化运维管理措施,实现运维管理的“人员、技术、流程”相结合的阶段。这一阶段所具有的显著特征就是要求IT运维管理服务能够解决上述四种问题与矛盾,提高IT运维管理的应用水平。
从赛迪数据显示统计出,2013年中国IT运维市场规模达到300亿元,2014年中国IT运维市场规模增长率为23%,2015年IT运维市场增长率约为28.7%。由于企业用户对IT管理服务与业务价值的进一步解析,使得IT服务在企业发展生命周期中得到了前所未有的高度重视,每年运维市场将保持不断增长。
在IT运维需求发展进程中,用户对IT运维业务保障、故障处理以及IT运维体验度等更深层次的IT服务需求将表现得更加明显,即不仅仅满足于IT基础建设维护,还将为企业制定运维标准体系,提高运维流程自动化水平,并且在运维过程中为企业创造价值。
这也就是意味着,在企业发展过程中,IT运维管理将起着至关重要的作用和影响,推动甚至是决定着企业业务发展方向的关键因素。当企业IT真正了解 “业务价值支撑”与“业务价值创造”的区别,方能在云时代完成IT服务与业务价值的无缝对接,使企业IT部门迈入新一代智能化IT运维管理服务阶段。
解决方案——云时代平台化运维管理模式
赢领科技(LingSoft)和同行一起,经过多年来持续不断的探索和实践,结合了国内外先进技术,基于ITIL最佳实践和ISO20000、ITSS等国内外IT服务管理标准,支持跨平台、跨厂商,提出并形成了IT 运维服务管理的智能化、可视化、可量化、标准化管理的一体化综合平台化运维管理体系。
赢领科技(LingSoft)的云平台运维服务管理体系平台现已经广泛地应用在政府、电力、金融、教育、医疗、广电、制造业等国内外行业用户,以“稳、易、全、准”优点而得到广大用户认可。
界面直观友好
云平台运维服务管理体系功能完善,系统闭环,能够覆盖到数据中心的方方面面。能够帮助我们实现可靠的业务保障,从设备管理,业务管理,接入用户管理,深入的流量监测,到可扩展的采集架构,丰富直观的视图展现,完善的虚拟化资源管理,再到多角度的用户终端管理,全方位的IT软硬件监控.从点到面,从底层基础设施全面管理,辐射到运维的每一个角落,最终直接保障业务系统。
IT时代到DT时代“聚焦化”
IT时代是以自我管理为主,DT时代是以服务主导, DT时代,互联网不再只是技术加工具、一种工作加手段,它将深刻改变我们的生活方式、使用方式、思维方式,让越来越多人熟悉、掌握、运用。DT的核心,是关于数据驱动的创新,也就是基于海量数据的巨大价值挖掘为核心的创新体系及模式。IT时代是以信息流为中心,DT时代就是以数据流为中心。如果说IT时代的特点是占有、掌握、传输和控制,DT时代则越来越讲究开放、透明、体验IT工作具有很强的专业性,绝大多数业务人员缺乏IT知识,业务部门往往不知道IT到底能够实现什么。我们需要转为思考,从被动式响应到主动式服务。主动了解业务部门需求,协助进行分析,同时在软、硬件方面满足业务部门的需要,做好对业务发展的支撑。
在IT建设不断推进之下,各行各业信息化建设已经颇具规模。单位各职能部门都配备了信息化相应的管理人员,拥有各自的数据库、各自的操作系统、独立的应用软件和用户界面,比较大企业单位都设立了信息中心。据调查统计,用户运行的信息系统很多,建设项目不断延续、维护设备也不断延续,需要专业存储设备来承载。这些系统相互独立,缺乏统一的规划和标准,数据结构,缺乏数据交换标准。同时,各职能部门存在信息资源多头采集、混乱存放、孤岛管理、各自维护的现象,“信息孤儿”的现象也随之出现。
要将被动式变为主动式,我们进入了互联网时代。“互联网”能成为一个时代的名称,就在于互联网科技的发展改变了大家的生活方式和生存状态。互联网时代极大释放创造性劳动者,全面扩展了人们的社会关系,推动着整个社会向着“自由人联合体”的方向发展。将产品成为平台化服务桥梁,逐渐实现信息共享互联,就需要平台可以为各部门用户提供各自所需要的IT资源。
“云”之后,赢领科技(LingSoft)运维服务平台通过,统一的Portal实现数据中心网络、存储、安全、业务服务、机房动力环境、视频、可视化展示,实现云资源提供给用户群体。可以灵活的获取和按需调配云资源,避免了IT环境的重复建设,使得IT资源获取效率大大提升,成为云平台的“聚焦化”建设模式的成功样板,从而保证了业务、数据的安全。
标准化手机运维APP
在智能化故障管理方面,我们主要从多个维度,通过多种技术手段,像丰富的告警通知,内置多种事件解析规则,丰富的事件处理策略,获取来自数据采集层的有效告警信息,再通过自动的工单派发管理,手机终端方式处理运维工单,多样化的远程处理工具,及时的设备快照和故障恢复机制,灵活可自定义的事件根源分析,进行全面的故障诊断,最终实现数据中心的故障管理智能化。通过巡视管理实现自动化的周期性巡视、夜巡视、故障巡视、特殊巡视作业业务。
打造完善的数据中心运维管理体系
高效的IT服务管理通过有效的信息传递,全面的资产配置管理,标准化的运维流程管理,多级化管理,分布式部署,基于不同角色的运维管理,以及综合的IT服务管理视图 ,提供IT运维人员的绩效考核依据,将个人运维经验有效转换为企业内部运维知识,从人员,流程和技术三个方面,打造一个高效的云平台。运维管理从监控层、运营层和治理层,全面支撑信息技术业务管理,从而实现面向基础资源和面向业务应用两个层面的监控和管理。
我们的体系遵循ITIL实践标准对运维管理流程进行优化再造,实现对事件管理,问题管理、变更管理和配置管理等过程进行流程化、规范化管理;基于单点登陆的统一登陆Portal界面以及统一的管理门户,全面展示与业务相关联的所有设备和软件的应用状况和处理性能。
赢领科技(LingSoft)云运维平台,基层运维积累了对本部及外围运维工程师最适用的各种运维管理视图,可帮助工程师全面、高效的实现日常的运维管理工作,服务管理方面更是积累了ITIL管理的最佳实践以及ITSS国标要求,以CMDB为核心实现流程的快速定制,提升客户的量化服务能力和服务质量,提升了智能化运维管理平台。在业务管理上,从业务服务保障的角度,对设备运行状态、虚拟化资源、机房资源、视频资源,进行监控和管理,并建立高效和快速的故障处理机制;而具体的管理范围既覆盖了从传统的硬件、软件到虚拟化、链路、动力环境、视频监控等IT基础设施,也包含了终端用户的接入情况。另外我们的平台还提供移动终端运维管理接口、ITSS接口以及第三方系统接口,以方便和其它平台的迅速对接。
云运维管理体系帮助数据中心提升价值
IT部门的第一目标是业务保障,业务得到保障,企业的正常活动才能开展,必然IT运维管理体系必须面向业务,以业务为导向。我们的云运维管理体系支持IT管理与业务融合,实现了业务关联影响分析、业务支撑的服务评价和业务系统健康管理,为IT部门提供价值。通过我们的LingSoft运维管理体系,使IT管理与业务融合,IT管理目标来自于业务目标,以实现业务目标为导向,使IT管理服务于业务。最终能直观感知业务状态,业务风险,对业务故障更好地处理,使运维工作能够完美地为业务服务,业务能够更快从故障中恢复,获得更高的可用性。从运维服务管理体系获得可量化的服务质量指标,方便优化及汇报。提供了各IT组件对业务系统影响的权重度管理、各IT组件的容量预测,各IT组件的可用性监控;还能够对公司所有设备和业务系统的运行趋势进行分析,必要时提前预警,供管理决策。
赢领科技(LingSoft)云运维大数据分析。
云运维管理体系,以数据中心的运维管理为核心,提升了IT运维的可视化,可量化、自动化、智能化、云一体化。
为了保障良好的用户体验和数据时效性,运维工作变得为了保障良好的用户体验和数据时效性,归集日志、数据,平台提供:
1. 关联分析(可针对设备、指标、阀值等不同维度的数据进行关联分析)
2. 数据根源分析(可针对不同资源进行异常状态的根源分析,查看设置的管理策略是否合理性,指标引起设备异常的概率)
3. 海量存储分析(可以高效地存储、检索、调用任一时间采集的IT资源数据和告警)
4. 知识库分析(已千万条知识数据为基础,统计分析知识点和知识点的共性关系,提供多知识点对比分析,体现知识点在不同时间的关注度,知识点随时间变化的演化关系,方向、趋势、和热点)
5. 阈值分析(可以指定对任意指标进行阈值分析,查看我们设置的管理策略是否合理,以及这些指标引起设备异常的概率)
6. 健康值评分(可以对海量数据进行综合分析,给出每个资源的任一指标对于业务影响大小的量化参考值,并对资源进行健康度评分)。
我们一直再努力加快IT服务水平的整体提升,为未来绿色运维,高效运维提供新的新起点。第一,可让用户快速需要的快捷信息获取通道,为事中、时候监管提供数据基础和业务协同支持。第二,对单位的流程再造和管理体制变革起到积极推动作用。
云平台定位于引导和规范监控、运维服务行业的信息标准化,赢领科技(LingSoft)通过与业内机构一起合作,逐步建立和健全行业标准化规范。更加快了公司积极并有效参与到智慧城市建设中的步伐,同时对推动行业信息标准化、赢领云运维服务管理之地位起到了积极的作用。
赢领科技(LingSoft)立志做一家真正优秀的云监控运维服务企业,为客户提供最可靠的云监控、运维解决方案。在数据为王的云时代,做引领企业IT运维新理念的先锋企业。
备注:今天在网上看到的不错的文章,分享给大家。转载自广州赢领科技,作者詹岭。
本文出自 “11966385” 博客,请务必保留此出处http://11976385.blog.51cto.com/11966385/1839578
原文地址:http://11976385.blog.51cto.com/11966385/1839578