HP SuperDome服务厦门大学高性能计算中心案例

发表于:2007-06-09来源:作者:点击数: 标签:
2006年初,厦门大学引进了共采用256颗安腾2处理器的 HP SuperDome高 性能 计算集群系统,作为筹建中的高性能计算中心的核心设备。利用HP在高性能计算领域的强大优势,厦门大学打 造一流的高性能计算能力,为全校教学和科研工作提供强大的计算能力和方便的使

2006年初,厦门大学引进了共采用256颗安腾2处理器的clearcase/" target="_blank" >cc">HP SuperDome高性能计算集群系统,作为筹建中的高性能计算中心的核心设备。利用HP在高性能计算领域的强大优势,厦门大学打

造一流的高性能计算能力,为全校教学和科研工作提供强大的计算能力和方便的使用环境。

客户瞄准一流:最新技术+成熟产品

厦门大学高性能计算机系统是该校"985工程"公共资源保障与服务支撑体系的主要建设内容之一,也是筹建中的学校高性能计算中心的核心设备。该中心建成后,其大型SMP/NUMA计算主机的运算能力将居国内高校和科研院所前列,可为全校化学、物理、材料、海洋、环境、数学、生命、经济等学科,特别是新组建的11个科研创新平台和研究基地提供国内一流的高性能计算支持。

除了为本校科研与教学工作提供高性能计算能力,厦门大学高性能计算中心还计划对福建省和厦门市的高校、企事业单位开放,成为全省/市的高性能计算中心,并争取加入国家网格计算计划,实现与国内外计算网格的互联与资源共享。

基于上述应用需求,厦门大学对系统提出如下要求:既体现高性能计算机最新的技术,又同时具有成熟稳定的发展方向;完全64位(即硬件、操作系统及应用全部支持64位);能够高效稳定地长期运行;易于管理,方便扩展;设计合理,无系统瓶颈。

HP角逐胜出:把握需求+实力雄厚

在厦门大学对各厂商高性能服务器的考察决策中,HP遇到了几家主要竞争对手,经过和客户的不断交流和沟通,HP准确把握了客户的应用需求,充分利用自身在高性能计算领域的领先优势和强大实力,联合广州华南资讯科技有限公司一道,为厦门大学提供了高性能、稳定、高性价比的软硬件整体解决方案,最终在激烈角逐中胜出。

高性能计算机系统主要用于以批处理形式运行大量作业的计算,要求能够同时高效率支持多用户多作业的运行;对不同应用特点的用户群能够提供不同的使用环境,交互类型和批处理类型的负荷能够互不影响;能够合理分配不同类型的计算作业;能够在运行中方便快捷地更改计算资源的分配方案,以最大限度地提高计算资源的使用率;在突发事件等引发系统暂时中断服务时能够尽可能减少作业中断带来的时间损失和用户额外的工作量。HP提供的整体解决方案满足且优于上述要求。

高性能

HP为厦门大学提供的高性能计算机系统为SMP/NUMA集群结构,8台Integirty Superdome作为计算节点,共采用256颗1.6GHz、 9MB三级缓存的安腾2处理器,系统峰值达到1638.4GFlops,有效值为1531.56GFlops。Superdome服务器节点采用模块化的、Crossbar体系构架,整个系统最大提供256GB/s的内存带宽。

系统采用的安腾2处理器由HP/Intel共同开发,既代表了64位计算技术的最新发展方向,具有明确的发展路线图,同时又拥有足够成熟的产品。此外,该系统还采用了HP自行开发的SX1000芯片组、HP-UX操作系统和HP C/C++/Fortran编译器。

高可靠

本系统的关键部件都采用全冗余的、非单点故障的配置,包括计算网络、存储网络。计算节点采用具有极高可靠性的Superdome计算节点,能够克服处理器、内存、硬盘、电源等的故障。即使整个节点发生故障,管理人员也可以通过LSF提供的系统级Checkpoint/Restart功能和挂起/恢复功能,在无须修改用户应用程序源代码的情况下,将运行中的作业保存到磁盘中,作业在故障恢复后可以从断点保存处继续运行,从而节省用户宝贵的计算时间。

本系统配置了2个互为冗余又负载均衡的24口Infiniband交换机,管理节点还通过千兆以太网与校园网互联,保证网络单点故障不会影响整个系统的运行。系统的8个计算节点通过互为冗余的SAN网络,连接到共享磁盘柜EVA4000上,通过ADIC Sto.net存储管理软件,形成一个单一映像的SAN文件系统,实现多个节点共享、并发的、通过SAN 网络的存储共享机制。整个系统与厦门大学校园网络中的其他支撑系统(如集中共享存储)等有效地结合起来,构成一个完整和可扩展的高性能计算应用环境。

易管理

HP SuperDome高性能计算集群系统采用64位的HP-UX操作系统,通过Systems Insight Manager (HP SIM)和HP Integrity Essentials for HP-UX管理软件提供集中化的单点管理功能。具体而言,HP SIM通过一个统一的管理界面管理整个集群系统的硬件资源、软件资源、故障监控、配置管理等;通过在HP SIM中增加Integrity Essentials模块,又可提供集中化的操作系统安装和软件部署、分发以及系统配置管理功能。

该集群系统通过作业调度软件LSF的资源管理和优先级排队功能,能够合理、动态地分配资源给众多用户,满足厦门大学众多最终用户在教学科研工作中对资源的需求。HP还配置一台rx2620服务器作为管理和服务节点,通过千兆以太网连接到计算节点,负责集群系统的监控、作业提交等功能。

保持领先优势:联合实施+零距离服务

HP在高性能计算领域拥有绝对的领先优势。在最新出炉的第22期全球最大超级计算机(TOP500)排行榜中,HP再次成为最大的供应商--占据了其中165个席位,在安装量上远远领先于其他供应商。HP已经连续4次获此殊荣。在中国高性能计算市场上,HP同样拥有领先地位。在中国软件行业协会数学软件分会于2003年11月8日公开发布的2003年中国高性能计算机性能TOP100排行榜中,HP的总体装机量达到了57%。

HP为厦门大学提供零距离的售后服务和技术支持--HP 在福州和厦门设有办事处和常驻工程师,本项目提供的所有设备为3年7′24 小时的服务,响应时间为4小时。HP从来重视合作伙伴的优势和力量,在本项目中,HP联合专业精深的广州华南资讯科技有限公司,一同为厦门大学提供完善的解决方案和全面的系统测试、应用测试和可靠性测试,向用户交付最完美的应用体验。

原文转自:http://www.ltesting.net