网络系统管理的应用需求,随着网络环境的复杂和业务系统的应用而不断凸显,成为信息技术部门不可或缺的管理工具,而SNMP这种简单的管理方式正在开始逐步退出网络管理的舞台。
众所周知,传统的网络管理依靠SNMP(简单网络管理协议)这种针对IP网络管理网络节点(服务器、工作站、路由器、交换机等)。它作为一种应用层协议。使网络管理员能够管理网络性能,发现并解决网络问题,并通过SNMP接收随机消息。
管理不简单
目前用户的网络环境日趋复杂,比如国内某汽车生产商的网络环境中,运行Windows的服务器达到10多台,还有一台运行Solaris的服务器,核心交换机是两台华为的,接入层选用了20多台华为的交换机,路由器选用了3台Cisco的,另外还有两台Check Point的防火墙,而且还包括了SAP系统(执行于Oracle数据库),Exchange邮件系统,SQL数据库,WebSphere等应用。
在这样复杂的网络环境下,需要对服务器层、网络系统层、应用系统层搭建起立体式的运维管理,仅仅依靠传统的SNMP进行管理是很难实现的。
而且该企业多次在休息日发生系统宕机的情况,由于没有及时发现,造成系统长时间停机,影响各部门业务的正常开展。一方面,对用户的工作产生了很大影响,另一方面,由于故障不能及时定位,没有很好的故障报警措施,所以在故障排查方面,也给网络管理工作造成了很大的压力。
化被动为主动
SNMP这种简单的管理方式正在开始逐步退出网络管理的舞台,取而代之的是HP OpenView、IBM Tivoli、SiteView ECC这样的网络运维管理工具。在没有引入网管系统以前,用户主要是依靠操作人员报障来发现网络故障,对故障也没有预警的机制,处理起来非常被动。
企业中的网络管理工作总体上是一种被动式管理,网络管理员的主要工作是等故障出现然后再进行解决,属于事后处理的类型。每个CIO都希望能够主动对网络进行管理,让系统不停地自动检查各系统的运行状况,一旦出现问题能够及时发现,并能够得到即时处理。
另外,网络管理员通过各类日报表、统计分析功能、图形化分析界面对系统运行状态进行分析,通过分析可以发现问题的先兆,这样网络管理员就能在故障出现之前把问题消灭在萌芽状态。
哪怕是系统宕机出现故障了,也能够使用网管软件所提供的故障分析功能,及时找出故障的源头,为网络管理员在短时间内解决问题争取时间。将问题的发现权重新掌握在运维工程师手里,通过监测点阀值的设定,当接近危险值的时候,系统就会发出报警、通知。这样才能够让CIO可以预先掌握问题隐患在哪,部署调整解决方案