项目完成以后,进入运维。运维实际上不能称为一个项目,如果系统是稳定的,运维来说每天的工作差不多。运维的主要工作是让系统不间断运行,满足系统的SLA。运维和运营也不同,运营是对产品进行管理,运维是保障系统的运行和维护。运维的所有工作都在ITIL中有明确的定义和说明,简单来说运维项目最重要的内容是:运维流程管事务,运维制度管人员,运维规范定行为,运维工具提效率,运维文档管跟踪。
从结束的项目中接下来设备安装位置的机柜部署图,设备物理连接网络拓扑图,应用程序运行环境的运行部署图,安全设备部署和安全防护边界图,以及设备基本信息、设备及与其他设备接口、运行环境参数、系统策略和安全策略的一系列表格以后,针对这些内容开展后续的运维工作。
1、制定制度和规范。主要包括服务台规范,日常设备、系统及桌面巡检规范及定期巡检规范,工作会议、应急演练、运维事件、运维日报,人员考核等制度,目的是形成PDCA管理的闭环,更新运维知识库。
2、制定业务流程,一般来说包括服务台受理流程,应用系统上线、授权、变更流程,数字证书的办理、更新流程,网络、安全设备和系统的策略优化流程,以及硬件设备的调整和配置信息更新流程等。
有了以上的可行流程、制度和规范,能常年不懈的坚持执行下去,就能做好运维的项目了。运维虽然可以自动化,但也需要有人来管理,所以保持人员的稳定性对运维是有好处的。此外,运维要关注细节,例如系统宕机往往就是没有发现系统中的细节造成的。以下有一些关于运维的总结或者技巧:
1、如果所在单位没有运维的能力,运维要外包,运维也是按照项目方式进行管理;
2、时刻注意保持冗余,但一般不轻易使用冗余,特别是数据,数据的备份是日常工作,数据的恢复要定期做,一不小心哪些数据就恢复不过来了,数据安全不能只停留在纸面上;
3、阅读使用手册,画一张大的网络、安全、部署拓扑图,大家都胸有成竹认为哪些手册和没什么用,但实际上确实是有用的;
4、运维人员要保持AB角色,确保系统故障时候找不到人,运维人员不能只关注所工作的那些事情,外出学习和交流也是非常有必要的;
5、交接班记录非常重要,是责任的一种体现;
6、尽量使用自动化工具去辅助做任何工作,慎重的去做系统升级和打补丁,如果要做,做好所有的回滚措施,并一定提前演练一下;
虽然IT和运维不是一个概念,作为系统运维人员,保证系统不间断运行外,还可以有更高的追求。因为运维人员虽然不能看到业务数据,但是唯一知道所有软硬件系统、数据架构的人,也是知道应用系统现状、性能效果的人,所以,业务运行的优劣、技术基础设施的规划、架构的需求都可以在运维人员处得到答案。业务与IT充分融合,让他们参与到业务目标的制定当中,实现业务目标与IT的一致性,确保IT系统可以支撑日益增长的复杂业务,这才是IT价值的体现。
网友评论