日常IT运维管理制度
为完成运维任务必须建立相应的技术支持管理制度,使维护工作做到有章可循,有据可查。同时对制定的各个制度的执行情况进行质量考核,对运维团队的工作绩效进行评估,促进制度更好落实,确保高质量地完成各项维护支持任务。
10运维管理制度总则
101运维保障机制
(1)建立硬件、网络、系统,应用及业务软件日常维护流程机制;(2)建立故障应急处理流程机制;(3)建立备份恢复保障机制;(4)建立安全保障管理机制;(5)建立版本管理机制,管理平台生产环境运行的软件版本;以上机制应形成文档,作为日常遵循规范.按要求执行。
102硬件维护能力
需对硬件设备具备724小时不间断的支持、响应能力,原则上每日对硬件设备至少检查一次并记录;定期对网络环境进行检查。对服务器进行硬件检测,内存、硬盘、IO的使用情况进行查询并进行登记,每台服务器运行的软件对硬件性能使用情况检测,对于服务器我
f们进行系统备份,每日对网络使用情况进行观察,针对突发异常流量进行分析。
103故障处理响应及需求
设备(系统)出现故障时,根据不同的故障级别提供相应的服务
响应,响应方式及要求如下:
故障级别
故障内容
响应时间及效其他
果
Ⅰ级别
出现系统故障,工程师及时响
一般故障
不影响系统运应处理,24小时
行,不影响业务内解决。
对于硬件故障
正常运作
(含机房环境
Ⅱ级别
出现系统故障,工程师及时响故障),要求不
次要故障
影响系统运行应处理,8小时论在何时确诊
或影响非关键内解决
需要进行备件
业务运作,不影
更换,发出备件
响核心业务运
更换指令起3小
作
时内备件到达
Ⅲ级别
出现系统故障,工程师及时响故障现场,并恢
重大故障
系统崩溃或其应处理,2小时复系统正常运
他状况,影响核内解决
行。
f心业务的正常运行
104具备应急预案
针对部署并进行实施系统备份、软件重要数据实时备份,主机备份是提供的保留某个时间点上的主机系统数据状态的服务。基于主机备份可以随时生成或删除备份,并基于已备份进行主机的恢复,实现已有应用和主机数据的快速复用,如系统出现事故无法使用将进行系统恢复并把最近一次备份的数据进行恢复。对于突发情况建立应急服务流程,主要是针对可能发生的各种意外情况设计应急方案。以控制和规避突发事件带来的集中性风险,从而降低设备集中性风险所造成的损失。
105数据库维护能力
每日对数据库进行日常巡检r