一、背景说明
随着IT技术在企业的应用,许多企业已经建立了核心业务系统,如ERP、OA、数据仓库等,业务策略驱动IT策略的建立,IT策略支持业务策略,由此,许多企业的运作已经离不开IT系统了,因此任何一个故障造成的损失,影响面是比较大,甚至影响整个企业的业务。而传统的运行维护管理模式比较被动, 即只有当系统出问题时, 才会引起注意和得到解决, 或者当业务受影响, 并被业务部门汇报投诉,才发现问题。 这种管理模式已经不能适应目前环境下业务的需求。
其次,从生命周期的角度看,无论是硬件还是软件,大致可分为规划和设计、开发和测试、实施、运营和终止等5个阶段。前面3阶段从时间的角度看,只占生命周期的20%,其余80%的时间基本上是运维服务,如果整个IT的运维做得不好,那么这些花费大笔投资建立起来的系统,无法带来预期的效益,甚至于无法使用,因为使用者无法顺利使用他们。
根据Gartner Group调查发现,在经常出现的问题中,源自技术和产品方面的其实只占了20%,流程失误占40%,人员疏失占40%。流程失误包括变更管理没有做好、超载、没有测试等流程上的失误或不完整,人员疏失包括遗忘、训练不足、备份错误及安全疏忽等。这就说明IT运维方面的问题,更多的不是技术问题,而是来自管理方面,因此对IT系统需要一套管理系统来支撑,这就是运行维护系统。
二、信息系统运行维护面临的挑战
一般信息系统架构的层次如下:
由此,我们可以看到,为了保证应用系统的可用性,不但要保证应用程序本身的正确性和健壮性,同时还要保证从网络到应用程序端到端的可用性,为此,从运行维护的角度来看,必须从整体的角度来规划,对与应用系统相关的IT基础设施、支撑平台进行集中监控,并与应用系统进行关联,一旦出现故障,可以迅速定位并解决;同时定义相关的流程保证一个应用的变更不会对其他应用产生影响,对出现的问题从根源上找出原因,并进行解决,从而保证系统的高可用性。基于本人对IT服务管理的理解,基于ITIL的框架,提出运行维护系统建立的一些想法。
三、运行维护系统的设计
那么如何设计IT运行维护系统呢?主要从两方面着手,一是管理流程的设计,二是系统监控的设计。在管理流程方面,目前ITIL(IT Infrastruct Library)基本上成为事实上的标准,它是最佳实践的结晶;在系统监控方面包括从IT基础设施应用系统进行监控,并实现事件的关联,以实现主动的监控,实现故障的快速定位和预警,下面具体说明。
(一)运维系统的设计理念运维系统的设计理念基于ITIL-IT服务管理框架,ITIL 将IT 服务管理分为:
●服务管理,包括“提供IT 服务” 和“支持IT ”服务两部分,关注在提供IT 服务过程中,监控,管理,处理解决问题的整个过程。
●面向业务的管理,将从业务的视角来看管理,将管理IT 服务与IT 服务所支撑的业务关联。
1. 信息和通信基础
框架管理IT 基础框架的智能管理是服务保障的基础,应该是一个可以全面管理IT 基础框架中所有产品和技术的平台,并通过提供以下能力达到真正的业务价值、真正的投资回报、保障安全生产,提高服务水平。
IT 基础框架的智能管理将覆盖企业IT环境,提供包括广域网,局域网,主机接入网络,网络安全设备,Internet 服务的全方位的IT 从网络到系统,应用,业务的监控管理,以及面向IT运维的事件压缩,事件相关性分析,故障诊断,根源故障分析,自动化的故障处理等一系列功能和工具。
2. 服务管理今天,正进行着服务
管理的革命。几乎所有企业的IT 部门都正在向面向业务的服务提供者的转变。IT部门就像一个合作伙伴一样参与到企业的业务过程,主动的提供服务职能,并向它的客户-业务部门负责。
ITIL 将企业的IT 服务管理分为:
提供IT服务,关注在提供IT 服务过程中和管理行为和手段;
支持IT 服务, 关注在支持IT 服务过程中,处理问题,变更等的动作和流程。
(1)提供IT 服务提供IT 服务包括:制定规划,为业务部门按计划和服务质量提供服务保障提供服务的持续性。
在服务提供体系实现的主要任务是:
■服务水平管理
■可用性管理
■容量管理
■成本管理
■应急方案
(2)支持IT 服务支持IT 服务包括:为达到服务目标提供相关管理信息。为实现服务目标提供相应的支撑机制。
服务支持体系实现的主要任务是:
■配置管理
■帮助台管理
■问题管理
■变更管理
■软件控制和分发管理
3. 面向业务的管理面向业务的IT 管理是从客户视角的端到端服务监控管理,它的特点是:
提供直观的监控视图,能够实时判断通信和IT 基础框架故障对业务的影响;
在发生影响业务的故障时,IT服务保障部门能够最快的获知问题的发生,并迅速采取行动;
根据故障对业务的影响情况,决定处理的优先级;
当业务服务发生问题时能够确定故障所在的基础框架层次;
通知相关客户服务系统或大客户,告知问题的状况和解决进展;
面向客户业务服务,提供基于Web 的多种视图,包括端到端服务监控层次模型,和监控构成服务系统的各个组件;
面向业务管理的宗旨是通过全面的业务系统和IT 框架系统监控,增强管理,提高管理水平,并最终保障业务的成功运行。实现IT基础框架端到端的监控和与业务的关联。
(二)运维系统的设计目标●确保IT流程支撑业务流程, 整体提高业务运营的质量。
●提高用户的满意度, 提升企业的社会效益和经济效益。
●实时实现对从IT的基础架构到应用系统的端到端的运行情况进行监控。
●提供从业务角度分析IT基础设施(包括系统、网络、数据库、应用服务器)的能力。
●建立完善的支持服务流程和支持模式。
●建立满足服务水平要求的服务水平管理。