2 规划和设计
当规划和设计一个高可用的集群时,你必须依从客户的所有需求.你应该对硬件和网络配置及应用如何做到高可用有一个很好的理解.你也应该能控制应用失效时的行为.
知道应用失效时的发生的动作是很重要的,这样你就知道当情况发生时怎样控制集群的反映.
规划和实现集群的需求包括应用程序,环境,硬件,网络,存储和支持改变的程序.
这一章描述了hacmp集群的下列主题:
1.节点的注意事项
2.集群硬件规划
3.软件规划
4.存储的规划
5.灾难恢复计划
2.1 规划的考虑事项
当规划一个高可用的集群时,你应该考虑节点的大小,存储,网络等.去提供必须的资源去正确的运行应用程序,以至于当一个接管时间发生时.
2.1.1 sizing 在集群中选择一个节点.
在你开始去实施一个集群时,你应该知道它需要多少节点,需要什么规格的节点.节点的规格对于应用所需要的资源组是很重要的.
节点的规格需要考虑下述方面:
1.CPU(cpu的数量和速度)
2.每个节点上的内存总量.
3.内置磁盘的容量.
4.每个节点上的通信和磁盘适配器的数量.
5.节点的可靠性
集群中的节点数量依赖于集群中运行的高可用应用的数量和对可用性需求的程度.为每一个应用提供超过一个分离的节点可以提高所有应用的可用性.
NOTE:HACMP 5.1的中单个集群的最大节点数是32.
hacmp5.1支持多种节点,从桌面系统到高端服务器.SP节点和lpar也被很好的支持.需要更新的信息,可以参考hacmp规划与安装向导,SC23-4861-02.
集群的资源共享是基于应用程序的需求,执行任务的节点不是直接关联到高可用的应用并且不需要在应用节点间分享资源时分开配置这样实现了容易的配置和管理.
所有的节点需要提供足够的资源(CPU,存储和是适配器)去维持所有指定的应用在接管的情况下(接管失效节点上的资源).
可能的话,你需要额外去添加一个节点到集群中,去提高集群的可用性.这样也为执行节点接管,重新整合和维护操作提供了更好的弹性.
我们推荐集群中的节点使用相似的配置,特别是实施应用相互接管和并行操作的集群中.这样可以很容易去分布资源和执行系统管理操作(软件维护等).
2.1.2 存贮的考虑事项.
在大多数的用户配置中,保持高可用的应用需要为应用的数据创建一个共享的存贮空间,共享的存储空间也可以用来作并发的存取,或者可以在接管的节点上提供应用对数据的可用.(当失效接管发生时).
在集群中使用的存储需要为所有指定节点上的全部应用提供共享的存取.hacmp当前支持的共享存储技术有SCSI,SSA和光线通道.
存储的配置需要根据应用的需求配置为非共享的(private)或者共享存储.私有的存储可以设置在内部的磁盘上但不支持接管行为.
共享存储可以提供守约束的存取机制,基于下列的原因.
1.放置在共享存储上的必须保持可存取对每一个节点上的应用在一个时间点上(非并发的),但在一些情况下,并发的存取是必须的.
2.在非并发的环境,如果共享的数据被错误的节点更新,这将导致数据损坏.
3.在并发的环境中,应用有自己的数据存取机制,在并发的软件平台(AIX,hacmp)支持下.
2.1.3网络事项
当你计划一个hacmp集群,下列方面是要考虑的:
1.IP网络的拓扑(路由,交换等)
2.IP网络的性能(速度,带宽和冗余)
3.ATM和x.25网络配置
IP网络是用来提供客户端存取集群中节点上的应用,并且用来交换集群中节点间的心跳信息..在一个hacmp集群中,心跳信息通过IP网络和点对点网络.
hacmp可以设计为通过基于TCP/IP的网络,X.25和ATM网络.
2.2 HACMP集群规划
集群的规划或许是重要的多半部分步骤去实施一个成功的配置.hacmp规划可以根据下述方面考虑:
1.硬件计划
节点,网络,存储
2.软件计划
操作系统版本,hacmp版本,兼容的应用.
3.测试和维护计划
测试程序.改变配置的管理,管理操作.
硬件规划:
设计一个高可用集群的主要目标就是消除单点故障(软件,硬件和网络)去提供高可用的服务,并且避免应用被打断,包括计划的和非计划的.
节点计划的因素:
支撑节点:机器类型,特性,支持的卡,电源支持,
连通性和电缆:电缆类型,长度.连接器,模块数,路由管道,电缆盘需求和可用性.
2.2.1节点配置
hacmp5.1支持IBM p系列(独立的节点和lapr),IBM sp节点.遗留下来的RS/6000服务器,节点必须达到AIX最低的配置.
1.内部磁盘 2.共享磁盘容量和保护方法(raid和lvm镜像).3.I/O槽限制创建一个非单点故障.4.客户端存取集群(网卡适配器)5.其他LAN设备(交换,路由,网桥等).6.冗余的I/O适配器和子系统.7.冗余的电源支持
2.2.2 网络配置
规划集群的网络的主要目标是评定你需要消除网络组件潜在的单点故障的冗余度.下面的方面是要考虑的.
1.网络:节点连接到多个网络.
2.TCP/IP子系统故障:非ip网络去支持检测这种类型的故障
3.网络接口:冗余的网卡在每个网络上,当单个网络接口故障时阻止资源组故障.
当规划一个集群的网络配置时,你必须选择适当的节点连接.
1.集群网络的拓扑(交换机,路由等)
2.组合ip和非ip网络连接到你的集群节点和每个节点上一定数量的连接到所有的网络.
提高ip服务地址的高可用的方法:
1.IP地址接管通过IP别名.
2.ip接管通过IP置换.
文章来源于领测软件测试网 https://www.ltesting.net/