来自人体的灵感
客户终端、Web服务器、防火墙、功能服务器……一堆复杂的设备组成了现有的IT系统环境,其中遍布着大量的接合点、相互依赖关系、硬件和软件版本控制问题、不断增加的安全隐患等等,其复杂程度有增无减。这除了增加管理成本以外,还经常使IT管理人员力不从心。
但是我们看到,人体的复杂程度不亚于任何IT系统,却不存在上述问题。天热时,人体会通过排汗来散发热量;天冷了,它会发出信号让人加衣服;当人从光明走进黑暗时,瞳孔则会根据环境光线的强弱来控制其孔径的大小……这一切都是通过自主神经系统来实现的,不需要主人刻意发出指令。
IT系统是否也能拥有这样的自我调节能力而无需人为的过多干预呢?这就是自主运算的思想——将复杂性嵌入到系统设施本身,使用户觉察不到复杂性,只需发号施令而不必关心系统执行命令的具体过程。这意味着,系统本身能够自主运行,并自我调整以适应不同的环境。自主运算即得名于人体的自主神经系统,但它们的重要差异在于,人体做出的很多自主决定是不自觉的,而计算机系统的自主运算组件则遵循人所下达的命令。自主运算也不同于人工智能,虽然后者在某些方面对其有借鉴意义。自主运算并不将模仿人类思维作为主要目标。
自我管理的四大法力
其实,基于自主运算思想的一些技术早已见诸于IBM的服务器部门,明显的例子是在IBM eServer服务器中的自主管理和自主恢复技术。其中,动态工作负载管理,使服务器中的分区可以按需扩展或伸缩,从而为给定的工作负载提供足够的计算资源;可扩展集群,用交换和内部互连机制将多个AIX Unix服务器或多个Linux服务器“集群”在一起。
简言之,自主运算就是让IT系统具有自我管理的能力。在一个自主运算的环境里,系统的所有组件,从计算机硬件到操作系统和企业应用软件,都应该具备自我配置(Self-Configuring)、自我修复(Self-Healing)、自我优化(Self-Optimizing)、自我保护(Self-Protecting)这四种能力。
自我配置指系统根据组件的增减或流量的变化动态地自我重新配置,以使架构始终保持强健和高效;自我修复能够让系统侦测到运行中的错误,并且在不妨碍系统正常工作的前提下自动修正错误,这对提高系统的可用性有很大帮助;自我优化则意味着系统根据用户在不同时刻的不同需求或流量重新调配资源,以保证最佳的QoS;自我保护能力确保当未授权的入侵、病毒攻击等具有敌意的行为或系统过载发生时,系统能够及时发现并实施保护。下面以人们很熟悉的IBM PC为例,具体解释这四大功能给用户带来的好处。
自我配置
ImageUltra Builder功能可以通过创建并管理镜像,使PC可以在无人参与的情况下自动安装应用程序,可用于包括IBM或其他品牌PC的混合环境;系统移植助理则通过保存用户的设置,使用户特殊的数据、应用以及个人设置从旧系统向新系统转移时更容易。
自我恢复
快速恢复PC(Rapid Restore PC)是此功能的典型例子,这是一种单键式恢复解决方案,它能使PC用户快速、轻松地实现文件数据乃至应用程序和操作系统本身的恢复。
自我优化
IBM Aclearcase/" target="_blank" >ccess Connections软件可以让用户轻易地在多种有线或无线的网络中切换,而不必操心网络连接时的设置变更过程。
自我保护
IBM嵌入式安全子系统,利用系统集成的安全芯片和客户安全软件,提供了同时基于软硬件的保护措施。自我保护的另一个例子是IBM分布式无线安全监控器(Distributed Wireless Security Auditor,DWSA),它能帮助用户持续地监视无线网络接入点,以杜绝非法用户窃取商业数据。利用DWSA,无线网络中的每一个客户机都在监视着它所能“看到”的访问节点,并持续地向中央服务器提交报告。根据这些报告,系统管理员就可以判别哪些访问是非法入侵,并实时采取相应的措施。
自我管理的这四大特点就是自主运算环境的核心,它们揭示了IT系统所执行的这些配置、修复、优化以及保护的任务是基于技术本身所侦测到的环境,同时这些任务也是由同样的技术来解决的,即“用技术来管理技术”。自主运算对用户最直接的好处,是减少了复杂系统维护时对人的依赖性,从而大大降低了维护费用,同时也提高了面对变化时的应对能力。其深层的好处则是可以让企业将精力放在核心业务的发展上,而不是浪费在作为服务工具的IT系统上。
架构的三层管理机制
需要强调的是,自主运算的实现依赖于整个系统的自主能力,而不是自我管理的各部分的简单相加。所以自主运算需要一整套系统的方法,以在运算系统的整个网络中进行协调和自主管理。
那么对庞大复杂的自主运算架构的管理又是怎样实现的?整个IT系统及服务器、客户端等组件是由无数的智能控制环(Intelligent Control Loop)管理着,这些控制环扮演着资源管理器的角色,从系统收集信息、做出决定并根据需要调整系统。所有的控制环构成了一整套标准的功能和相互作用的系统。
每种管理功能都采用了不同的控制环,而控制环本身隐藏在管理工具中或嵌入在系统资源中,所以控制环只能通过一系列的功能来体现。这些控制环(或者说是管理器)可以彼此之间或与高级的管理器一起为了共同的目标而相互作用。例如,一个数据库系统需要同服务器、存储子系统、存储管理软件、Web服务器以及其他系统组件来共同营造一个自我管理的IT环境,而控制环能够将其复杂性在最终用户和IT管理人员面前隐藏起来。
通常,一个强大的IT系统会有成千上万个活跃的控制环。为了让管理工作秩序井然,自主运算架构定义了三个不同的管理层,控制环所处的层次就决定了它们的角色和任务(见附图)。
金字塔的最底层是资源组件层,由企业网、服务器、存储设备、应用、中间件以及PC等组件组成。通过提高每个独立组件的自我配置、优化、修复以及保护能力,自主运算在这一层就开始了。
再往上是复合资源层,那些组件被聚合在这一层,并且彼此间开始互相联系,以建立一个自我管理的环境。以一个服务器池为例,若干台服务器来动态地调节流量和结构,以达到性能和可用性的某种目标。
最上面是企业解决方案层,复合资源与客户管理系统、电子拍卖系统等企业解决方案紧紧捆绑在一起,真正的自主行为发生在这一层。自主解决方案根据企业的策略、计划、服务水平等诸如此类的东西,来理解企业业务流程的最佳状态,并且将业务流程的优化结果传送回复合资源甚至独立的组件。
进化五步曲
营造自主运算的环境不是一夜之间所能促成的。实现自主运算的理想之路可以划分为五个阶段,企业从基础阶段开始,经过管理阶段、预知阶段以及适应阶段,最终到达自主阶段(见附表)。
基础阶段是构建IT环境的起点,架构中的每个组件由建立并监控它们的IT管理人员独立管理; 在管理阶段,系统管理技术被用于从不同的系统中搜集并合成信息,以此来减少当IT环境更复杂时网管收集并合成信息的时间;在预知阶段,新的技术被用于提供各组件的协作,这些组件已经能够开始识别模式、预测最佳的结构并为网管提供建议;在适应阶段,系统能够根据获取的信息以及系统的情况自动采取正确的行动,在该阶段由于所有的技术都有所改进,而且系统能够提供建议并具有预测能力,管理人员的压力减轻了许多;在自主阶段,企业的策略和目标控制了IT架构的运行,用户通过监控企业的业务流程和目标实现状况,来与自主运算技术的工具相互作用。
需要强调的是,将管理系统的负担移交给自我管理技术,这个过程并不会很快完成,也不能只依靠新产品推出,还需要采用一些技能并改变业务流程。当企业在自主运算的五个阶段中前行时,业务流程、工具会变得越来越复杂,但由于IT系统的自我管理能力越来越高,所以对IT管理人员在技能方面的要求会越来越多地转向与企业自身的业务相关。
结语
自主运算让人们能够把更多的时间、更多的注意力节省下来,而用于IT系统维护之外的业务处理上,并且节省大量的IT维护成本。自主运算所描述的境界看似一个神话,因为所有的IT设备都可以实现自我管理。事实上,这的确是项艰巨的工程,面对着许多挑战。
首先,要想在一个存在多个供应商的IT架构中实现自主运算,必须要有一个开放的平台。其次,在异构的环境中,需要一个具有统一接口和控制点的体系结构。此外,还需要有一个平台向其他平台提供扩展能力,而对系统管理的身份认证和关系的定义,以及如何有效地将企业策略通过系统策略表现等等问题同样需要解决。
最后再需要强调的是,自主运算并不是一个产品或一种具体的应用程序。这个目标的实现并不只是通过新的技术,而是要通过采用新技术,改变业务流程,开发新技能、新架构和开放的行业标准来综合实现。