Sun Cluster 将 Solaris(TM) 操作环境推广到一种群集操作系统。群集是一种松散耦合的计算节点集合,提供网络服务或应用程序(包括数据库、web 服务和文件服务)的单一客户视图。
每个群集节点都是运行其自己的进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据。
与传统的单一服务器系统相比,群集有几个优点。这些优点包括对高可用性和可伸缩性应用程序的支持、适应模块化增长的容量和与传统硬件容错系统相比的低进入价。
Sun Cluster 的目标是:
减少或消灭由软件或硬件故障引起的系统停机时间,确保数据和应用程序对最终用户的可用性,而不管故障属于什么类型;这些故障通常引起单服务器系统停机。
通过向群集添加节点,使服务随着处理器的添加而伸缩,从而增大应用程序吞吐量
提供增强的系统可用性,使您能够不必关掉整个群集就可执行维护
Sun Cluster 的高可用性
Sun Cluster 是作为一种高可用 (HA) 系统(即提供对数据和应用程序几乎不间断的访问的系统)来设计的。
相比之下,容错硬件系统提供对数据和应用程序的持续访问,但由于使用专用硬件而成本更高。另外,容错系统通常不能解释软件故障。
Sun Cluster 通过硬件与软件的结合取得了高可用性。冗余的群集互连、存储器和公共网络防止了单点故障的发生。群集软件不间断地监视成员节点是否完好并阻止故障节点加入到群集中,从而防止数据破坏。同时,群集监视应用程序和相关的系统资源,并在出故障时进行失败切换或重新启动应用程序。
有关高可用性的问题与解答,请参考 高可用性 FAQ。
Sun Cluster 的失败切换和可伸缩性
Sun Cluster 使您能够或者在失败切换的基础上,或者在可伸缩的基础上执行应用程序。失败切换和可伸缩应用程序也可以同时在同一群集上运行。一般来说,失败切换应用程序提供高可用性(冗余),而可伸缩应用程序除了具有高可用性之外,还具有更高的性能。单一群集既可以支持失败切换应用程序,也可以支持可伸缩应用程序。
失败切换
失败切换就是群集自动将应用程序从一个故障主节点重新定位到指定的辅助节点的进程。有了失败切换功能,Sun Cluster 就具备了高可用性。
当失败切换发生时,客户可能会看到一个短暂的服务中断,并可能需要在失败切换结束后重新连接。然而,客户并不知道哪一个物理服务器向他们提供应用程序和数据。
可伸缩性
当失败切换忙于冗余时,可伸缩性提供持续的响应时间或吞吐量,而不用去关心负荷。可伸缩应用程序利用群集中的多个节点来同时运行一个应用程序,从而增强了性能。在可伸缩配置中,群集中的每一个节点都可以提供数据和处理客户请求。
Sun Cluster 硬件部件
本章中的信息主要面向硬件服务供应商。在服务供应商安装、配置或维修群集硬件之前,这些概念可帮助他们理解硬件部件之间的关系。群集系统管理员可能也会发现这些信息很有用,它们可用作安装、配置和管理群集软件的背景信息。