Sun Cluster 3.0 最常见的问题的解答

发表于:2007-07-01来源:作者:点击数: 标签:
本章包含关于 Sun Cluster 的最常见的问题的解答。问题是按主题编排的。高可用性 FAQ 到底什么是高可用系统? Sun Cluster 将高可用性 (HA) 定义为群集使应用程序保持活动状态并运行(即使发生通常会使 服务器 系统不可用的故障)的能力。 群集是通过什么样


本章包含关于 Sun Cluster 的最常见的问题的解答。问题是按主题编排的。高可用性 FAQ 到底什么是高可用系统? Sun Cluster 将高可用性 (HA) 定义为群集使应用程序保持活动状态并运行(即使发生通常会使服务器系统不可用的故障)的能力。 群集是通过什么样的进程提供高可用性的?通过一个称为失败切换的进程,群集框架提供高可用性的环境。失败切换就是一系统列由群集执行的步骤,它将应用程序从一个故障节点转移到群集上另一个可操作节点。 HA 服务与可伸缩服务间有什么不同? HA 服务意味着应用程序每次只能在群集中的一个主节点上运行。其他节点上可能运行其他应用程序,但每个应用程序只能运行在单一节点上。如果主节点发生故障,正在故障节点上运行的应用程序进行失败切换,切换到另一个节点并继续运行。可伸缩服务将一个应用程序扩展到多个节点之上来创建一个单独的逻辑服务。可伸缩服务平衡他们在其上运行的整个群集中的节点和服务器的数目。一个节点接收所有的应用程序请求,并将这些请求分发给运行着应用程序服务器的节点。如果这一节点发生故障(它被称作全局接口节点或 GIF),则全局接口失败切换到一个仍运行的节点。在任何一个运行着该应用程序的节点发生故障时,该应用程序在其他节点上继续运行,只是性能有所下降,直到故障节点返回该群集为止。 文件系统 FAQ 可否将一个或多个群集节点作为高可用性 NFS 服务器运行,而将其他群集节点当作客户机?不可以。本地锁定接口存在一些问题,有能力中止和重新启动 lockd(锁定是在 NFS 失败切换期间发生的)。在中止与重新启动之间,可以将锁定授予一个被阻塞的本地进程,从而防止了拥有该锁定的客户机系统在失败切换后要求归还锁定。 可否将群集文件系统用于不在 Resource Group Manager 控制之下的应用程序?是的。然而,没有 RGM 的控制,当运行应有程序的节点发生故障时,应用程序将无法幸免。 所有的群集文件系统都必须在 /global/device-group 目录下有一个定位点吗?并非必须。然而,将群集文件系统置于相同的定位点之下,比如 /global/device-group,使这些文件系统可以得到更好的组织和管理。 使用群集文件系统和导出 NFS 文件系统有哪些不同?有以下几点不同: 群集文件系统支持全局设备。NFS 不支持对设备的远程访问。 群集文件系统有一个全局名称空间。只需要一个定位命令。使用 NFS 时,必须在每个节点上定位文件系统。 与 NFS 相比,群集文件系统从高速缓存访问文件的情况更多。例如,当多个节点访问一个文件,进行访问读、写、文件锁定、异步 I/O 时。 群集文件系统在某一服务器发生故障时支持无缝失败切换。NFS 支持多服务器,但只有只读文件系统有可能进行失败切换。 群集文件系统是为了利用能够提供远程 DMA 和零拷贝功能的快速群集互连而建立的。 如果您更改了文件的属性(例如,使用 chmod(1M)),更改会立即反映到所有的节点上。使用导出的 NFS 文件系统,这可能会花费更长的时间。 卷管理 FAQ 需要镜像所有磁盘设备吗?必须镜像被视为具有高可用性的磁盘设备,或者使用 RAID-5 硬件。所有数据服务应该要么使用高可用磁盘设备,要么使用定位到高可用磁盘设备上的群集文件系统。这样的配置可以容忍单独磁盘故障。 数据服务 FAQ 什么样的 Sun Cluster 数据服务是可用的?支持的数据服务列表包含在 Sun Cluster 3.0 发行说明 中。 Sun Cluster 数据服务支持哪些应用程序版本?支持的应用程序版本列表包含在 Sun Cluster 3.0 发行说明 中。 我可以记下自己的数据服务吗?可以。有关详细信息,请参见 Sun Cluster 3.0 Data Services Developers@# Guide 和 Data Service Development Library API 附带的 Data Service Enabling Technologies 文档。 当创建网络资源时,我应该指定数字 IP 地址还是主机名?指定网络资源的首选方法是使用 UNIX 主机名,而非使用数字 IP 地址。 当创建网络资源时,使用逻辑主机名(一个 LogicalHostname 资源)与使用共享地址(一个 SharedAddress 资源)有什么不同?无论在那里,只要文档要求在 Failover 模式资源组中使用 LogicalHostname 资源,SharedAddress 资源和 LogicalHostname 资源就都可以替交地使用。SharedAddress 资源的使用会造成一些额外的开销,因为群集联网软件已为 SharedAddress 而配置,而不是为 LogicalHostname 而配置。使用 SharedAddress 的优点是这样一种情形,您正在配置可伸缩和失败切换两种数据服务,并想让客户能够使用相同的主机名访问这两种服务。在这种情形下,SharedAddress 资源与失败切换应用程序资源一起包含在一个资源组中,而可伸缩服务资源则包含在另一资源组中,并被配置为使用 SharedAddress。此时,可伸缩服务和失败切换服务两者可以使用在 SharedAddress 中配置的同一组主机名/地址。 公共网络 FAQ Sun Cluster 支持哪些公共网络适配器?目前,Sun Cluster 支持以太网(10/100BASE-T 和 1000BASE-SX Gb)公共网络适配器。因为新的接口可能会在将来得到支持,所以请向 Sun 销售代表咨询以获取最当前信息。 在失败切换中 MAC 地址起什么作用?当失败切换发生时,生成新的地址解析协议 (ARP) 软件包并进行广播。这些 ARP 软件包包含新的 MAC 地址(节点失败切换到的新的物理适配器的地址)和旧的 IP 地址。当网络上的另一台机器接收这些软件包之一时,它从其 ARP 高速缓存中清除掉旧的 MAC-IP 映射并使用新的映射。 Sun Cluster 中是否支持在 OpenBoot PROM 中为主机适配器设置 local-mac-address?=true?不支持,不支持此变量。 群集成员 FAQ 所有的群集成员都需要有相同的 root 口令吗?不要求让每个群集成员使用相同的 root 口令。但是,您可以通过在所有的节点上使用相同的 root 口令来简化该群集的管理。 节点引导的次序有重要意义吗?多数情况下并不重要。但是,引导次序对防止失忆很重要(关于失忆的详细信息,请参考 定额和定额设备)。例如,如果节点 2 是定额设备的属主而节点 1 停机,并且您此时将节点 2 停机,那么您在启动节点 1 之前必须先启动节点 2。这可避免意外使用过时的群集配置信息启动节点。 是否需要在群集节点中镜像本地磁盘吗?需要。尽管这一镜像并不是一种要求,但是镜像群集节点磁盘可防止非镜像磁盘故障使节点停机。镜像群集节点本地磁盘的缺点是,将耗费更多的系统管理开销。 群集成员的备份结果是什么?您可以对一个群集使用多种备份方法。一种方法是将一个节点作为备份节点,连接一个磁带机/库。然后使用群集文件系统来备份数据。不要将此节点连接到共享磁盘上。关于备份和恢复过程的其他信息,请参见 Sun Cluster 3.0 系统管理指南。 群集存储器 FAQ 多主机存储器的为什么具有高可用性?多主机存储器的高可用性,是因为它可以在单磁盘丢失时因镜像(或者由于基于硬件的 RAID-5 控制器)而幸免于难。因为多主机存储器设备有不止一个主机连接,所以它也可以经受它所连接的单一节点的丢失。 支持什么样的多主机存储器配置?当前不支持超过两个节点的连接。在单一包围内的所有多主机磁盘必须连接到相同的两个节点。有关详细信息,请参考 Sun Cluster 拓扑。 可以将为 SCSI-3 PGR 配置的磁盘作为全局设备吗?目前 Sun Cluster 中不支持 SCSI-3 PGR。对于全局磁盘设备,仅支持 SCSI-2 语义。由于不支持 SCSI-3 磁盘,所以使用 scdidadm(1M) 命令时必须使用 -R 选项,以便为您想在群集中用作全局设备的 SCSI-3 磁盘设置正确的 SCSI 语义。 群集互连 FAQ Sun Cluster 支持什么样的群集互连?目前,Sun Cluster 支持以太网(100BASE-T 快速以太网和 1000BASE-SXGb)群集互连。对可伸缩相关接口 (SCI) 的支持也在计划之中。 客户机系统 FAQ 使用群集时是否需要考虑任何特殊的客户需要或限制?客户机系统正如它们连接到其他任何服务器那样,也连接到该群集。在某些情况下,根据具体的数据服务应用程序,您可能需要安装客户方软件或执行其他配置更改,以使客户可以连接到该数据服务应用程序。有关客户方配置需求的详细信息,请参见 Sun Cluster 3.0 Data Services Installation and Configuration Guide 中的单独章节。 管理控制台 FAQ Sun Cluster 是否需要管理控制台?需要。 管理控制台必须专用于该群集吗?它可以用于其他任务吗? Sun Cluster 不需要专用的管理控制台,但如果使用,则具有下面这些益处: 通过对同一台机器上的控制台和管理工具进行分组,启用了集中式群集管理。 可能会使硬件服务供应商更快地解决问题 管理控制台需要位于群集“附近”,比如在同一房间内?请向硬件服务供应商咨询。供应商可能会要求控制台位于群集的近旁。使控制台处在同一房间内没有技术上的原因。 是否只要所有距离要求也首先得到满足,管理控制台就可以服务于不止一个群集?是的。可以从一个单独的管理控制台控制多个群集。也可以在群集间共享一个单独的终端集中器。 终端集中器与系统服务处理器 FAQ Sun Cluster 需要终端集中器吗? Sun Cluster 3.0 不需要运行终端集中器。Sun Cluster 2.2 要求一个终端集中器来进行故障防御;与 Sun Cluster 2.2 不同,Sun Cluster 3.0 不依赖于终端集中器。 我知道大多数 Sun Cluster 服务器都使用终端集中器,而 E10000 却不使用。为什么呢?对于大多数服务器来讲,终端集中器实际上是一个串行到以太网的转换器。其控制台端口是一个串行端口。Sun Enterprise E10000 server 没有串行控制台。系统服务处理器 (SSP) 是控制台,它或者使用以太网端口,或者使用 jtag 端口。对于Sun Enterprise E10000 server,总是将 SSP 用于控制台。 使用终端集中器有什么益处?使用终端集中器提供从网络上任何地方的远程工作站对每个节点的控制台级访问,包括当节点是在 OpenBoot PROM(OBP) 时。 如果使用 Sun 不支持的终端集中器,需要了解什么来对我想要使用的终端集中器进行限定? Sun 所支持的终端集中器与其他控制台设备之间的主要差别,是 Sun 终端集中器有特殊的固件来防止终端集中器在控制台引导时向控制台发送中断。注意,如果您有一个控制台设备,可以发送中断或发送可能被解释为发给控制台的中断的信号,那么该控制台设备将关闭该节点。 是否可以不重新引导而释放一个 Sun 所支持的终端集中器上的锁定端口?是的。注意需要重置的端口号并进行如下操作:

te.net tc Enter Annex port name or number: cli annex: su - annex# admin admin : reset port_number admin : quit annex# hangup # 有关配置和管理 Sun 所支持的终端集中器的详细信息,请参考 Sun Cluster 3.0 系统管理指南。 终端集中器本身失败时会发生什么情况?我必须有备用终端集中器吗?不必。如果终端集中器发生故障,您不会丢失任何群集可用性。您将无法连接到节点控制台,直到集中器恢复工作。 使用终端集中器时,其安全性如何?通常,终端集中器连接到系统管理员使用的一个小型网络,而不连接到用于其他客户访问的网络。您可以通过限制对该特定网络的访问来控制安全性。

原文转自:http://www.ltesting.net