HP9000小型机管理与维护系列问题(13)
发表于:2007-07-04来源:作者:点击数:
标签:
其他日常维护之系统备份与恢复 1.为什么要做备份 备份是防止用户数据丢失的重要手段,备份的最终目的是确保数据的 安全 ,我们知道以下各种灾难总是难以避免: Hardware(disk) Failure 尽管现在多数存贮设备都具有冗余功能,但也不能确保不出现数据丢失(例如
其他日常维护之系统备份与恢复
1.为什么要做备份
备份是防止用户数据丢失的重要手段,备份的最终目的是确保数据的
安全,我们知道以下各种灾难总是难以避免:
Hardware(disk) Failure
尽管现在多数存贮设备都具有冗余功能,但也不能确保不出现数据丢失(例如种种原因出现两个以上的硬盘同时损坏等)
Database /Application Cor
ruption
数据库和应用中总是存在
bug,或是由于管理上的疏漏而出现数据库表空间和堆栈等溢出而导致数据被破坏等等。
Administrator Error
系统管理员在日常维护过程中总是难免会犯错而出现误删数据等。
User Error
用户的错误往往也会使数据需要恢复到从前某个时段的状态。
Site Disater
生活中有很多不可抗因素和自然灾害如:火灾,洪水,地震,雷击等会造成数据彻底丢失。
2. 备份什么
操作系统的文件及配置
硬盘空间文件系统的划分信息
用户profile及个人目录
应用及数据库系统的执行代码及文件
用户数据
3.备份的分类方式
OS/Database Backup
Incremental/Full Backup
Online/Offline Backup
Local/Network Backup
4. 典型的系统备份策略
javascript:window.open(this.src);" style="CURSOR: pointer" onload="return imgzoom(this,550)">
数据库数据通常时刻在变,因而要每天作备份,而应用系统及OS通常在其本身版本升级,打补丁,配置调整后要重做全备份。总之原则是,当系统信息全部丢失时,依靠手头的备份能够以最快的速度进行恢复,且信息损失最少或没有损失。
为了达到这一目的,我们在备份时一定要注意做到:
①组织一种适合自己实际情况的备份策略。
②将磁带存储在异地。
③定期清洗磁头。
④不要使用有故障的磁带。
一般来说,我们有三种不同的备份策略,这三种备份策略的区别在于备份所使用磁带的数量不同,这三种策略分别是:
①三带轮换策略:适合小型系统,能保存三个星期内的
网络数据。
如果采用三带轮换策略,我们必须拥有三盘磁带,称为磁带1、磁带2、磁带3。在第一个星期的星期一我们用磁带1作一次完全备份,然后在剩下的几天作部分备份(只备份新的或改动过的文件〕。在第二个星期的星期一我们用磁带2作一次完全备份,在剩下的几天作部分备份。同理,第三个星期用磁带3备份。在第四个星期时,我们将取出磁带1,重新开始新一轮备份。
②六带轮换策略:能保存两个星期内的数据。
如果采用三带轮换策略,这就意味着我们从星期一到星期四的每天都分别使用一盘磁带进行部分备份,然后再用一盘在星期五作完全备份,剩下那盘留在下个星期五作完全备份。这样我们就可以存储最近两个星期的所有数据。这个备份策略可以用下图表示:
③十带轮换策略:能保存三个月内的数据,尤其适用于需要经常进行完全备份的大型系统。
如果我们采用的是十带轮换策略,那么我们可以对前12个星期内的数据进行有效的备份,这十盘磁带的分配方法如下:
部分备份:星期一 星期二 星期三 星期四
每周完全备份:第一个星期五 第二个星期五 第三个星期五
每月完全备份:第一个月 第二个月 第三个月
十带轮换备份的示意图如下:
注:图中的空白磁带表示每第四个星期五都要使用一盘最旧的月备份磁带进行每周的完全备份
OS的备份
可以使用如下工具和命令
1.make_recovery -A -C
此命令备份整个根盘逻辑卷组,恢复时只需从备份的磁带引导,不需交互即可恢复整个根盘逻辑卷组信息。
2.copyutil
用于在硬盘及磁带间bit to bit 复制.
Application备份
1.fbackup -i /sample -e /sample/except -f /dev/rmt/0m
此命令用于备份除了/sample/except外的/sample文件系统到磁带机/dev/rmt/0m上
2.tar cvf /dev/rmt/0m /sample
将目录/sample备份至磁带上
Data in DBMS的备份
Informix,
oracle,sybase等数据库都有自己的备份工具ontape,on-Achive,on-Bar,数据库数据的备份可依赖这些工具,或是将数据库用于存放数据的文件系统,逻辑卷用tar,fbackup,dd等命令作备份。
5.备份系统和数据
1. HP-UX Core-OS:
这部分内容主要包括一些HP-UX用到的文件系统,如
/, /opt, /var,/tmp, /usr, /home, /stand
通常这些文件系统位于vg00中。
备份的方法:
(1) fbackup :
# fbackup -0vi / -f /dev/rmt/0m
-I /tmp/fbackupfiles/index/full.`date ’+%y%m%d.%H:%M’`
2 > /tmp/fbackupfiles/log/ full.`date ’+%y%m%d.%H:%M’
详见 ( fbackup的常用方式二)
(2) make_recovery :
# make_recovery -C -A -b /tmp/oslif.rec
详见 ( make_recovery)
2. 系统配置文件
对于系统一些关键性的文件或信息需要单独进行备份
这样有利于对系统进行恢复。这些文件或信息包括:
(1) 系统Swap 信息
#swapinfo -t
(2) 系统文件系统信息
#bdf
(3) 系统的 I / O 信息
#
ioscan -fnCdisk
(4) /etc/fstab
(5) 系统逻辑卷配置文件
/etc/lvmconf/vg00.conf 、vg01.conf、vg02.conf
这些逻辑卷配置文件可以用命令:
vgcfgbackup / vgcfgrestore 生成和恢复
3. 系统其它逻辑卷 ( 如:vg01 、vg02)
备份的方法:
(1) fbackup :
# fbackup -0uv / -f /dev/rmt/0m -g /tmp/fbackupfiles/mygraph -I /tmp/fbackupfiles/index/full.`date ‘+%y%m%d.%H:%M’` 2 > /tmp/fbackupfiles/log/ full.`date ’+%y%m%d.%H:%M’`
(2) tar
# tar cvf /dev/rmt/0m /oracle/app /home/oracle
4. 数据库的备份
由数据库软件提供,请参照数据库的备份方法
6. 谁负责备份(who)
定期对系统进行备份和在系统失效时恢复系统是系统管理员和数据库管理员的一项主要职责。他们应检查备份的状态并妥善保管备份。
7. 备份的介质和设备(where)
下面是每种备份介质的简单比较数字。根据你的数据量、要求的
性能和备份/恢复的策略选择合适的介质。
DLT磁带库和 Autoloader 可以实现自动备份。
8.备份的方法(how)
备份有许多可选的方法。根据环境选择正确的方法是成功备份/恢复策略的关键。
备份策略举例
下面是一个虚拟的例子:
1. 备份方案和环境
在本例中,我们采用OmniBackII作为备份工具:
1. 备份策略:
备份恢复策略
有了备份策略,还必须考虑再出现不同的故障时,应该怎样实施相应的恢复。例如,操作系统受到破坏时,应该怎样恢复?考虑到此时可能有不同的状况,可能会采取不同的恢复方法。比如,系统管理员确切地知道只是某几个文件被误删除,则只需简单地从被分钟会这些文件即可;负责,就可能需要用make_recovery进行系统的完全恢复。
也就是说,有了备份策略,管理人员还需要考虑不同情况下的恢复方案,并制成相应的文档,从而保证在紧急情况下正确地恢复系统。
另外,还需要定期地对备份和恢复策略进行
测试,以确保方案的可行性。
恢复策略举例
以下是一个虚拟的恢复策略:假设用户有两台机器,采用MC/ServiceGuard提供高
可靠性。
指定如下的恢复策略:
1. 系统崩溃 / 操作系统单节点启动失败
-> 服务的可用性:不间断服务,服务会自动切换至另一节点。
-> 恢复程序/预计恢复时间
Step1.用 “cmviewcl –v” 命令和数据库功能检查群集状态,如失败,参见例2。
Step2. 用根盘的镜象盘重启系统,如成功,转至 step7 (30 Min)
Step3. 用“make_recovery” 备份的磁带重启系统,并恢复操作系统,如成功,转至 step6 (1.5 hour)
Step4. 给惠普支持中心打电话,在惠普支持工程师的帮助下解决问题。
Step5. 如要重装操作系统,用“make_recovery”或“fbackup” 的备份的磁带恢复操作系统.
否则,转至 step6 (1.5 hour)
Step6. 如果需要,从 Omniback Cell Server安装 Omniback 介质代理和磁盘代理and disk
agent,并且恢复 操作系统的全备份和增量备份,使操作系统回到最近的状态。 (2 hours)
Step7. 用“cmrunnode” 命令把节点连到群集。
2 :系统崩溃 /操作系统双节点启动失败
-> 服务的可用性:服务大约30分钟不可用。服务切换到第三台V-Class 上的备用数据库, 数据库恢复和客户机重连接要花费一些时间。
-> 恢复程序/预计恢复时间
Step1. 切换服务到备用数据库, 运行数据库恢复和重连客户机到备用数据 (30 Min)
Step2. 用根盘的镜象盘重起系统,如成功,转至 step7 (30 Min)
Step3. 用“make_recovery” 备份的磁带重启系统,并恢复操作系统,如成功,至 step6 (1.5 hour)
Step4. 给惠普支持中心打电话,在惠普支持工程师的帮助下解决问题。
Step5. 如要重装操作系统,用“make_recovery”或“fbackup” 的备份的磁带恢复操作系统.
否则,至 step7 (1.5 hour)
Step6. 如果需要,从 Omniback Cell Server安装 Omniback 介质代理和磁盘代理and disk agent,并且恢复 操作系统的全备份和增量备份,使操作系统回到最近的状态。 (2 hours)
Step7. 用“cmruncl” 命令启动群集,并检查群集状态。
Step8.夜间把服务转移到主数据库,并检查数据库功能。
3 : 根盘硬件损坏
-> 服务的可用性:不间断服务,服务会自动切换至另一节点。
-> 恢复程序/预计恢复时间
Step1. .用 “cmviewcl –v” 命令和数据库功能检查群状态,如失败,参见 例2。
Step2. 用根盘的镜象盘重起系统,如成功,至 step6 (30 Min)
Step3. 给惠普支持中心打电话,在惠普支持工程师的帮助下解决问题。
Step4. 如要重装操作系统,用“make_recovery”或“fbackup” 的备份的磁带恢复操作系统.
否则,至 step6 (1.5 hour)
Step5. 如果需要,从 Omniback Cell Server安装 Omniback 介质代理和磁盘代理and disk agent,并且恢复 操作系统的全备份和增量备份,使操作系统回到最近的状态。 (2 hours)
Step6. 用“cmrunnode” 命令把节点连到群集。
例4 : 数据盘硬件损坏
-> 服务的可用性:服务大约30分钟不可用。服务切换到第三台V-Class 上的备用数据库 , 数据库恢复和客户机重连接要花费一些 时间。
-> 恢复程序/预计恢复时间
Step1. 切换服务到备用数据库, 运行数据库恢复和重连客户机到备用数据 (30 Min)
Step2. 给惠普支持中心打电话,在惠普支持工程师的帮助下解决问题。
Step3. 用 OV-Omniback 恢复数据库全备份和归档备份 (> 2hours)
Step4. 从备用
数据库备份数据表,在夜里用 Omniback 将它恢复到主数据库。 (2.5 hours)
Step5. . 用“cmruncl” 命令启动群集,并检查群集状态。
Step6. 在夜间将服务转移到主数据库并检查数据库功能。
操作系统备份与恢复工具
如在“备份策略”一节中所述,由多种方案可以对操作雄和文件系统进行备份,例如,
-> fabckup/frecover
-> tar
-> dd
-> cpio
-> copyutil
-> make_recovery
-> OmniBackII
等等。
1. 用fbackup / tar 对系统进行备份时
1) Install Core-OS
2) 恢复vg00 / vg01 / vg02 的备份内容
# frecover -o -r -f /dev/rmt/0m
2. 用make_recovery 对系统进行备份时
1) 用磁带boot system, 恢复vg00
详见 make_recovery 的恢复方法
2) 恢复其它逻辑卷
# frecover -o -r -f /dev/rmt/0m
原文转自:http://www.ltesting.net