标题: 标签在运维管理中的应用(4) [打印本页] 作者: 就爱抬杠 时间: 2012-7-1 11:36 标题: 标签在运维管理中的应用(4) 在ITIL V3中,对事故流程和问题流程进行了重新的定义。) ~6 \4 E' z1 h. U4 B6 T) |- J, T
% F/ c! @" h4 R* W0 y4 O' K; u
传统的事故管理流程在ITIL V3被分为事件管理、事故管理和请求实现三个流程。简单的说,事件指的是所有可察觉和可识别的,对IT服务或IT基础设施造成影响的现象;事故则指已经或者有可能对IT服务(这里不包括IT基础设施)造成影响的事件;请求实现则是指预先定义好的一些低风险或无风险事件,例如经常发生的低风险变更,服务咨询等等。/ x I1 p( P, A
5 J# R% V" [# R1 T1 C; s5 ]: Q7 [9 t
为什么要这么区分?因为新的事故管理流程更强调事故处理的本质特征,也就是“快速恢复”。“快速恢复”可能意味着要投入更高的关注,更多的资源,甚至掩盖问题产生的原因。如果事件不足以对服务产生影响或者威胁,哪怕对IT基础设施造成了影响,也不应当纳入事故管理流程。 M# S8 `( L( H 0 s! s) r! D: a" D% D2 a问题管理流程仍然保持原有的含义,着眼于追究问题产生的原因和本质。因此,问题流程的一个重要来源就是事故管理流程。; l6 W" z, e! _& H$ [
4 m/ O" V; Y- b7 {0 C
在前面的讨论中,为了简单起见,我们没有区分事件和事故的区别。事实上,当然只有“事故”才值得或者说才能从业务视图的角度,根据对业务的影响来定级。当然理论上来讲用对“服务”的影响更好,但这个需要IT和业务部门充分沟通后才能实现。但在前面的讨论中,也有一些地方确实指的是“事件”。7 d- s8 M. {. A h: c1 ]
) `/ Z: z! |4 q$ [' S' M2 F在新的ITIL V3中,对服务持续改进流程进行了定义,其中提出了服务改进的七步法流程: # ^4 o( p- \) F- Y: [ / x. c, A, d0 z' L. j q. J确定哪些需要衡量) f& _6 S+ `/ Z* K+ d! w7 g" r7 l
明确哪些可以衡量 $ q6 G1 v1 @5 W" t搜集数据 3 I+ N# X- g" t7 s h" Y处理数据 & y( ]! Z. J& x' W% B$ X/ M分析数据 $ L5 A0 z& h. ~9 S3 b展示信息并使用信息 8 {! C& ^( R; \. I O, |采取合适的措施( _1 j! Z) U: X/ D5 v
0 H8 N& [# w s Y9 f9 E9 [! N1 A在我看来,这简直就是对实现标签管理的精准描述。首先确定需要定义哪些标签;然后明确哪些标签是实际可行的,能为运维人员理解、接受和使用;对嵌入标签的事件流程进行搜集、处理和分析,由于有了标签,这一切都变得相当容易;展示结果,采取措施。9 V a# |+ q& @3 S$ C) b