日常维护检查

发表于:2007-07-04来源:作者:点击数: 标签:
日常维护检查使用指南 硬件 在这部分中,我们检查以下内容: 面板指示: 在大多数的服务器中,都由一个液晶面板,显示服务器的执行状态。在正常情况下,应该是FxxF的格式。在系统出现故障时,会出现WARNING或FAULT的提示。具体请参见《技术指南》。 系统管理

  日常维护检查使用指南
  硬件
  在这部分中,我们检查以下内容:
  面板指示:
  在大多数的服务器中,都由一个液晶面板,显示服务器的执行状态。在正常情况下,应该是FxxF的格式。在系统出现故障时,会出现WARNING或FAULT的提示。具体请参见《技术指南》。
  系统管理员应该定期检查该指示,确认系统正常工作;否则,应该立即联系HP公司。
  服务器中的各个扩展卡的指示灯
  在服务器中,存在多种扩展卡,例如,SCSI卡(连接SCSI设备),以太网卡等。这些卡都由一个或多个指示灯。从这些指示灯可以了解这些卡的工作情况。
  具体情况,请参见各个卡的说明书。
  SCSI卡:
  在正常情况下,自检灯(self test)应该是暗的;终结电源指示灯(Terminator PWR)是亮的
  以太网卡:
  在正常情况下,自检灯(self test)应该是暗的;连接灯(Link)是亮的
  其他卡:
  外设的状态
  大部分外设也都由自己的状态指示。下面是比较常见的几种:
  
  M10,M20,M30磁盘阵列
  这些磁盘阵列,正常情况下,硬盘的指示灯:应该是绿色;如果变成黄色,则说明该磁盘发生故障。
  维修灯(Service Lamp):
  应该是绿色;如果变成黄色,则说明该阵列中存在故障部件。例如,硬盘故障。
  AutoRAID磁盘阵列
  该磁盘阵列有一个液晶面板。如果出现故障,在面板上会出现Warning提示信息。
  磁带库
  磁带库一般也有一个液晶面板。如果出现故障,在面板上会出现报错信息。
  其他外设
  XP256:该外设实全冗余的如果有部件发生故障,会自动通过DDN拨号到美国技术中心。
  其他硬件检测:
  在N4000中,有一个attention灯,正常情况下,该灯应该是暗的。如果是黄色的,则说明系统中存在一些问题。
  操作系统
  在这一部分,通过一些实用、简单的命令,检查系统的情况:
  控制台( console )显示
  在系统出现问题时,常常会在控制台上显示一些出错信息。系统管理员应该定期检查这些信息。这往往是最方便的方式。
  另外,在使用完毕后,应该确保退出控制台,从而避免一些安全性问题。
  命令“dmesg”
  系统中存在一个错误缓冲区,系统将自检信息和遇到的错误、报警放在该缓冲区中。
  我们可以通过dmesg命令,阅读该缓冲区。
  在正常情况下,该缓冲区只应该包含自检信息。如果出现了warining、error或者是一些不熟悉的信息,应该仔细检查或通知HP服务人员。
  命令“uptime”
  该命令显示了系统自从上次重启以来运行的时间。通过该命令,可以知道系统是否发生了异常的重启。
  命令“bdf”
  系统中文间系统过满,有时会导致系统工作不正常。
  我们可以用该命令显示了文件系统的使用情况。
  如果发现某个文件系统过满,需要及时采取措施,或者删除无用的信息,或者扩大该文件系统。
  命令“mail”
  系统在发现问题时,往往会把一些信息发给root用户。
  系统管理员应该定期检查root的mail信息,以确认系统中不存在异常。
  日志“/var/adm/syslog/syslog.log”
  该日志文件中包含一些重要的维护信息。系统管理员应该定期用more或者vi命令,检查该文件。
  系统管理员如果发现warning、error、failure以及一些不熟悉的信息,应该提高警惕。
  命令“cmviewcl”
  对于运行了双机备份软件的用户而言,应该定期检查系统的运行情况。
  确认应用包、节点和网络均正常工作。
  其他命令
  用netstat –in检查网络状况,尤其是ATM网卡。
  备份
  系统管理员应该检查:
  是否按照计划完成了备份
  备份过程是否正常
  应用
  系统管理员也应该养成定期检查应用的习惯。在支持服务中,操作系统工作正常,但用户应用由于种种原因无法正常工作的例子并不罕见。
  根据具体情况,系统管理员应该检查:
  应用的日志文件
  组成应用的主要进程的执行情况,例如数据库的DBWR,LGWR等等。
  
  

原文转自:http://www.ltesting.net