第一部分 服务器故障的处理响应
(一)、服务器故障的定义
本预案所指的服务器故障是指公司管理信息系统范围内的网络服务器设备的故障。包括因设备质量原因导致的系统故障、人为因素和网络系统外界因素而导致的系统故障、计算机病毒感染及遭受黑客或恶意代码攻击而导致的应用系统故障等。
涉及本预案的服务器设备包括小型机和PC服务器,设备清册参见附表1。
(二)、服务器故障的分类
以服务器设备的故障性质和故障可能涉及的范围,按照以下的标准进行分类: 服务器硬件故障:服务器硬件故障,包括服务器的底板故障、IO板及IO设备故障、CPU板及CPU故障、内存板及内存故障、磁盘阵列及磁盘故障以及磁带库故障等。这类故障将直接影响服务器的正常运行,情况严重的,将使服务器陷于瘫痪状态,基于该服务器的所有应用将无法正常使用。如果该服务器承担的是网络的控制和管理职能,将对整个管理信息系统造成极为严重的影响;如果该服务器承担的是单个或多个应用系统的运行和管理,那么,这些应用系统将无法提供正常的服务。
服务器系统软件故障:服务器的系统软件故障,包括操作系统故障、网络控制和管理系统故障、集群管理系统故障等等。严重的服务器系统软件故障,同样会使服务器陷入瘫痪状态。故障造成的影响,视该服务器承担的应用系统的不同而不同,如果该服务器承担了网络的控制管理或关键应用职能,将有可能造成非常严重的后果。
关键应用服务故障:关键应用服务故障,包括Oracle数据库故障、SQL Server数据库故障、PI数据库故障、OA故障、WEB服务故障、邮件服务故障等。这些应用服务软件的故障,对于相关的应用系统将产生一定的影响,其影响范围和损害程度随故障的性质和严重程度而定,严重的,将引起系统瘫痪。
(三)、服务器故障响应处理流程