现在大多数IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:①.IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;④IT部门和业务部门对IT运维的服务满意度都不高。 运维人员每天扮演者“救火员”的身份,但同时也没有得到相关部门的肯定,每次月度考核,总是差,这个是为什么列?有朋友可能会说,设备的问题,咱们能有什么办法,机器宕机了,我们又不没有及时处理,是的,问题是及时处理了,但是时间过去了,现在是一个高效率的时代,你只要慢别人半拍,那么你就有可能失去这个市场,这个道理最近在看一个电视剧《大时代》体验到的,虽然带有夸张的色彩,但是个人觉的并不夸张,你的运维系统总是问题不断,影响到客户的体验和使用,一次两次别人可以理解你,经常这样你拥有的客户就会失去,因为每个行业的竞争都很激烈。 然后咱们再谈谈运维系统的主要管理内容:据我个人所知,运维层面管理主要包括: 硬件层面:服务器、网络设备(路由器、交换机、防火墙) 软件层面:操作系统的实时运行状况监控、应用软件的实施和维护(ERP、CRM、OA)等 数据应用类管理:数据库、中间件(ftp同步传输)、邮件系统、web网站、域控AD等 存储/容灾管理:业务支撑系统数据备份、存储设备的管理和备份以及运行环境的性能监控 虚拟化平台管理:hyper-v 、esx等 信息安全:不仅仅是通信与运营层面的安全、病毒防护、入侵等 这些都是运维人员在被动的情况下实施操作的,在半自动化的运维层面下,很多始料未及的问题就容易暴露出来,然后赶紧将问题抹杀在摇篮中。这样高度集中的办事效率能事半功倍么,只会是差强人意。运维管理面临的这些问题,是否能有效的杜绝? 现在很多厂商提出了IT运维自动化,这些IT运维自动化不但可以有效解决企业信息化快速发展所带来的困扰,减轻运维工作的负担,还能帮助企业IT基架运维实现最佳的管理状况,让运维人员随时掌握企业系统的运行情况,能对突发状况作出主动,快速的反应,能为企业设备及海量的数据提供最安全有力的保障。 IT运维自动化虽然方便了维护和管理,也是未来的一种发展趋势,但是安装部署和实施也是需要时间的,购买软件的成本价格也不菲,这个价格成本也是很多企业老板不敢轻易去尝试的,所以好多事情真的不能想当然,产品固然很好,但是不是所有人能用的起。 当然,不管多么棒的自动化的管理和维护都离不开运维人员的干预,运维人员虽然在某些情况下减少了压力,但是维护的工作依然会是重点,IT运维是一份充满压力的工作。但是一旦意识到造成压力的某些因素,就可以解决大部分的压力,同时能够明白这份工作的确是值得的。有众多方法可以减少与同事的冲突、处理资源缺乏问题和常受干扰的环境、解决优先事项相互冲突的矛盾,以及积极接受这个现实:IT运维人员要对每一个失败负责。