随着网络从支持企业运营的一个组成部分发展到成为促进企业核心运营和服务的重要力量,企业网络状况的好坏已经成为影响企业生产效率的一个重要因素。同时,网络规模和复杂程度的提高,新一代高带宽应用的出现和发展都使得网管人员的角色变得举足轻重。一套智能化的网管工具会最大限度地把网管人员从繁杂的工作中解脱出来,降低网络管理和维护成本。
我们都知道网管包括配置管理、故障管理、性能管理、安全管理和计费管理五大部分。其实,这主要是针对电信运营网络而言的。对于企业计算机网络来说,一般不需要计费管理,安全管理则属于计算机安全建设领域,所以网管基本包括配置、故障和性能管理三个方面。目前,市场上各种网管产品主要是针对网络故障管理和网络性能管理这两个方面的。网络故障管理主要侧重于实时的监控,而网络性能管理更看中历史分析。它们不能代替管理员分析问题、解决问题,只能协助管理员监视网络、采集数据,及时报告问题,形成统计报表。
在记者对几个主要网管平台软件厂商技术人员的采访过程中,感受到网管软件的智能化也是围绕着如何能够更好地解决故障和性能管理问题进行的。
利用经验这笔财富
网管软件的重要作用就是能根据某些故障判断出根源所在或者依据某些现象对即将发生的问题提出预警,而这种判断或预测的准确与否往往取决于网管软件能否拥有强大的知识库或专家库,也就是经验的积累。随着技术的发展,一些厂家也在进行这方面的尝试,力图把专家系统、人工智能系统、神经元技术带入网络故障和性能管理领域,使网管系统逐步具备分析决策能力。
据HP软件部市场经理初明介绍,网管软件通过SNMP(简单网络管理协议)收集起来的日志信息需要进行过滤,因为绝大多数日志没有意义,HP结合自己多年的经验通过对以往事件的分析过滤掉无关日志信息,通过特定的数据模型或专家库进行事件相关性分析,从而自动解决某些问题。当一个设备发生故障时,会产生数百个事件。HP OpenView Network Node Manager的事件关联技术(ECS)并不会因为需要跟踪多个相关的事件而让网管员疲于奔命,而是会排列事件的顺序,为您网管员提供高级警报,在其中指出该故障在网络中的根源。
IBM Tivoli技术销售经理刘咏梅告诉记者,最佳经验是Tivoli网管产品中很重要的组成部分, Tivoli还提供了资源模型,可以智能化地判断单点故障问题,有效解决事件风暴,通过相关分析自动地实现这种功能,其中专家库也起了核心重要作用。IBM Tivoli 软件的“最佳实践方案”是在市场上拥有成功追踪记录的可靠的、可重复的程序。利用这种经验来确保解决方案的实施可以预测而且可靠。
自我管理和基于策略的管理
我们知道现在网络在强调自愈能力,其实网管软件也同样需要这种能力,CA中国公司产品经理谢春颖告诉记者,以往用户利用网管软件主要是完成管理、监控任务,今天网管的角色发生了变化,它能够根据业务情况进行自我调节,将网络和业务统一到一起进行管理。
IBM Tivoli当然更是在其随需应变的策略中将自主运算作为一大特性提出来,IBM认为自主计算的本质是通过使技术更智能化地工作来解放 IT 专业人员,使他们将精力集中在完成具有高价值的任务上。它是指系统自我管理,并视业务政策和目标的变化进行动态调整,以适应变化的能力。与通常由 IT 专业人员来启动管理活动不同的是,系统会对自身情况实施监控,并执行相应的管理活动。用刘咏梅的话来说就是,Tivoli网管软件将会发展成像人的神经一样实现自主管理,自主运算的自我配置、自我优化、自我保护、自我修复四个特征已经嵌入到Tivoli的26个产品之中,尤其是Tivoli还专门推出了自主运算引擎供第三方合作伙伴来使用,它们可以借此提高自己产品的自我管理能力。
这种自我管理的智能化特性对网管人员来说,只要把用户情况、设备情况以及用户与网络资源之间的分配关系输入网管系统,系统就能自动地建立图形化的人员与网络的配置关系,并自动鉴别用户身份,分配用户所需的资源,同时,整个企业的网络安全得以保证。
因为不同应用、不同级别的用户群所拥有的带宽,所获得的服务质量是不同的,因此可以通过网管软件进行策略配置来实现这种不同优先级的资源分配。
以业务服务为导向
业务与网络管理以前是很少在一起谈论,而如今各大厂商包括IBM、CA、HP和BMC等都纷纷将业务服务纳入到网管的范畴之中。随着用户对计算机系统要求的提高,网络管理已经不再仅仅面向管理员,提供辅助工具。它必须向最终用户负责,准确衡量和描述整个计算机系统和支持维护部门所提供的服务水平。提供全面、准确的系统总体服务水平报告是网管软件的发展趋势。
CA公司的On Demand管理策略深刻反映了这一点,CA的谢春颖告诉记者,网管软件不会再以是否存在故障作为衡量标准,而是以业务服务水平作为界定的原则,改变过去那种“头痛医头,脚痛医脚”的管理思路,通过服务订购方式根据服务水平将资源动态分配给用户,这种以服务为导向的方法将会大幅度提升用户的IT 管理流程和效率。
IBM Tivoli的 BSM(业务服务管理)将IT与业务紧密地联系起来,刘咏梅认为,如今企业中的IT人员,其中有80%属于IT支持人员,大多都处于被动地位,将IT与业务结合起来,会增加IT为业务所带来的价值,提升IT部门的地位。现在越来越多的用户开始认可业务服务管理,Tivoli已经有BSM项目在银行进行实施。
HP也同样认可业务服务管理的重要性,初明认为,网管在IT架构中的作用日趋明显,同时它与业务的关联性也在逐渐加强。因为最终用户所了解的仅是业务服务,但实际上这是要通过IT服务管理来进行保障的。HP非常强调流程化管理的理念,结合ITSM(IT服务管理)流程化方法定义IT服务,将规范的事件流程化,这样网管软件就可以按照流程自动化处理故障,更好地实现业务与IT之间的联动。
我们从上面所提到的网管软件的智能化特性就可以看到在使企业IT部门的反应速度大大加快的同时,还可以通过标准化、流程化思路提高IT服务水平,将IT与业务更紧密地结合起来,使IT更好地为业务部门服务。
编看编想
智能不是万能的
■潘永花
现在,很多用户已经建好网络基础设施,信息系统建设也日臻完善,在这之后,管理网络和系统都被提到议事日程上来。在与几位专业人士沟通的过程中,记者感受到国内网管水平依然还处于初级阶段,依赖设备厂商提供的管理工具依然是应用的主流,但可喜的是很多项目伊始已将网管列入考察网络方案的主要衡量指标,这也表明用户已经从注重新技术、新名词变得更为成熟,因为它们越来越认识到网络、系统建设的后续维护成本是相当高昂的。网管软件的应用水平与企业信息化的水平也是相类似的,象金融、电信这种信息系统建设比较成熟的行业网管水平也相对较高。
那么,是否选择了智能化的网管软件,网管员们就可以高枕无忧了呢?其实不然,智能化网管软件虽然在某些方面可以实现自动化处理,不需要网管员干预,但这并不意味着网管员不再需要懂得各种网络设备的特性、配置和部署。在网管系统的几个主要方面中,尤其是配置管理方面,网管平台所能起到的作用非常有限,主要还要依靠网络设备自带的配置管理软件或通过超级终端使用命令行来进行详细配置,因此网管员对网络产品、网络协议和标准的了解还是十分必要的。
同时,网管平台的网络故障管理虽然能够自动发现、生成和维护网络拓扑结构,形成网络模型,但模型的正确与否在很大程度上也取决于管理员的水平,因为网络设备的种类过多可能造成其中有些设备或拓扑的识别不一定完全正确,有可能有终端用户私自改变网络连接的情况,这都需要网管员参与将错误的模型更正过来。
还有一点,网管软件厂商需要提升的地方就是满足中国用户的一些个性化需求,比如用户对报表或统计要求与网管软件本身所提供的格式有一定差异,因此需要第三方软件厂商为用户在网管软件基础上做一些二次开发或定制化的工作。
我们要依靠网管软件,但并不能盲目相信它,网管员在享用网管软件智能化的同时,同样需要拥有专业的网络知识和经验。
延伸阅读
文章来源于领测软件测试网 https://www.ltesting.net/