• 软件测试技术
  • 软件测试博客
  • 软件测试视频
  • 开源软件测试技术
  • 软件测试论坛
  • 软件测试沙龙
  • 软件测试资料下载
  • 软件测试杂志
  • 软件测试人才招聘
    暂时没有公告

字号: | 推荐给好友 上一篇 | 下一篇

8.3. 災害復原

发布: 2007-5-25 23:49 | 作者: 未知 | 来源: Blog.ChinaUnix.net | 查看: 22次 | 进入软件测试论坛讨论

领测软件测试网

8.3. 災害復原

用腦筋實驗一下,下次您走進機房,環顧四周,想像機房毀了;不是只有電腦沒了,而是連整棟建築物都不復存在。接下來想像一下,您的工作是盡快在某個地方,形式不論地,在某個地方重建機房。您要怎麼做?

藉由這想像,您等於跨出了災害復原的第一步。災害復原是把您毀掉的機房用最短時間,復原成原來的樣子。不管造成災害的原因為何,目的都是一樣的。

災害復原的步驟很多,牽涉也廣。底下將為您指出這些過程的概觀與大方向,還有幾個需要牢記在心的要點

8.3. 災害復原

用腦筋實驗一下,下次您走進機房,環顧四周,想像機房毀了;不是只有電腦沒了,而是連整棟建築物都不復存在。接下來想像一下,您的工作是盡快在某個地方,形式不論地,在某個地方重建機房。您要怎麼做?

藉由這想像,您等於跨出了災害復原的第一步。災害復原是把您毀掉的機房用最短時間,復原成原來的樣子。不管造成災害的原因為何,目的都是一樣的。

災害復原的步驟很多,牽涉也廣。底下將為您指出這些過程的概觀與大方向,還有幾個需要牢記在心的要點。

8.3.1. 建立、測試、並完成災害復原計畫

建置備用地點很重要,但沒有災害復原計畫也是枉然。災害復原計畫面面俱到地闡明了整個復原過程,包括(但並不囿於)以下幾點:

  • 什麼樣的事件可能會引起災害

  • 什麼人有資格宣佈公司已經進入災害狀態,並啟動災害防護計畫

  • 啟動災害防護計畫後,準備備用地點的所需步驟

  • 所有實施計畫的關鍵人物所扮演的角色與承擔的責任為何

  • 為復原過程所儲存的硬體與軟體

  • 時間表,列出建立備用地點的人員為何;其中也該包括輪調計畫,以支援更長期的後續作業,並避免過度使用人力資源

  • 從備用地點轉移回機房(或移到新地點)的步驟

災害防護計畫通常寫在活頁紙上,計畫內容要愈詳盡愈好,因為災害發生後,這可能是除了備份地點外,唯一留下來、能幫您重建並復原資料的東西。

提示提示
 

災害防護計畫應該放在公司隨手可得的地方,副本則應該儲存在不同的地點。如果災害摧毀了您的工作地點,那還有副本可以用。最適合儲存的地方,是您備份媒介的儲存地點。在不違反公司安全政策的情形下,您可以放一份在關鍵人員的家中,以備不時之需。

像這麼重要的文件,需要審慎的評估(甚至需要專家協助撰寫)。

建 立了這份重要文件之後,您也該定期測試。要測試災害復原計畫,您不妨實際操作其中的步驟:親自前往備用地點,設定臨時的資料中心,從遠端執行應用程式,在 「災害」結束後將主控權交還原中心。大部分測試不需要做到百分之百;只要選擇幾項系統與應用程式做代表,在備份地點重建作業環境,執行一段時間,然後在測 試結束時,回復為一般運作狀態即可。

注注意
 

雖然災害防護計畫不一定會派上用場,但還是得保持在最佳狀態。資料中心的情形會變,所以計畫也要跟著變動,以反映現狀。很多時候,一份過時的災害防護計畫,會比沒有計畫來得更糟。因此,一定要定時(例如每季)檢視並更新這計畫。

8.3.2. 備用地點:冷、暖、熱

地點是災害防護最重要的環節之一,有地點才能進行備份工作。這地方稱為「備用地點(backup site)」。每次災害發生的時候,備用地點是您重建資料中心的地方,也是在災害發生期間,機房持續運作的地方。

備用地點有三種類型:

  • 冷(cold)備用地點

  • 暖(warm)備用地點

  • 熱(hot)備用地點

很顯然,這些名詞與備用地點的溫度無關,而是在災害發生時,您必須啟用備用地點所需的努力程度。

冷備用地點只不過是建築物中,一塊可用的空間而已。所有需要將服務復原的裝備,都要先取得再送到這地點,才可以開始復原工作。您可以想像,從啟用冷備用地點,到能夠完全運作為止,需要下非常大的功夫。

冷備用地點也是最便宜的方案。

暖備用地點則儲存了數量相當的硬體,配備跟資料中心的相同。要恢復服務,必須先取得最新的備份檔,然後開始空機復原,最後才能提供原有的服務。

熱備用地點則擁有目前資料中心的虛擬備份與系統設定,萬事具備,只欠最新的備份檔。如您所想的,這備用地點能在幾小時內,讓所有服務恢復運轉。

熱備用地點也是災害防護中,最貴的方案。

備用地點有以下三種來源:

  • 專門提供災害防護服務的公司

  • 自己公司所擁有或經營的地點

  • 跟另一家公司簽署協定,在災害發生時,共用資料中心

以上每種方法都各有利弊。舉例來說,跟災害防護公司簽約,能帶給您專業服務,引導公司完成整個建立、測試、並實作整個災害防護計畫。相信您也可以猜到,這種服務絕對所費不貲。

使用自家公司所有或所經營的另一組設施可能沒有成本因素;但保留這麼一個備用地點,加上維護費用,依舊得花上許多成本。

與另一家公司簽署協定,共享資料中心可能是最不花錢的方案;但並不適合災害發生後長期使用。因為對方的資料中心必須維持其正常營運,讓整個情形為之緊繃。

最後,您必須在成本與企業需求(包括持續性與產能)間,找到最適合的備用地點。

8.3.3. 軟硬體的可用性

您 的災害防護計畫應該要包括如何取得軟硬體,以供備用中心復原所有服務。專業管理的備用中心應該有您所需的所有東西(如果中心沒有您需要的東西,您得安排特 殊料件的取得與配送);另一方面,您必須為冷備用中心準備所有需要用的東西。通常公司會跟快遞簽約,在災害發生時,能以最快的速度取得軟硬體。

8.3.4. 取得備份檔

當宣佈進入災害狀態時,基於兩個原因,您必須通知異地儲存的人員:

  • 把最後一份備份帶到備用地點

  • 安排人員取得正常備份檔,並送到備用地點(好在備用地點繼續正常的備份工作)

提示提示
 

災害發生時,舊資料中心的最後一份備份顯得異常重要。做任何事以前,都應該拷貝一份留存,然後把原版的備份馬上送到備用地點去。

8.3.5. 備用地點的網路連結能力

如果資料中心沒有辦法與組織連接,也無法為使用者提供服務,那麼這個資料中心就失去它應有的功能。根據災害防護計畫與災害的本質,您的使用者可能位於備用地點的幾公里之外。在這種情形下,要讓機房重新上線,好的網路連結能力,就顯得非常重要。

另一個要注意的連接能力,則是電話線。記得要確定新地點有足夠的電話,讓您的使用者相互溝通。之前只要在辦公室裡大喊一聲,就可以找到人;但現在沒有電話就無法相互聯絡。因此有備才能無患,多準備幾條電話線路會比較好。

8.3.6. 備用地點的人員配置

備用地點的人員配置不是個小問題。其中一點,是決定要把哪些人派往備用地點,讓新的資料中心長久運作下去。雖然少數核心人員就可以讓備用地點運作一陣子;但如果災害持續下去,環境日趨惡劣,就需要更多人力以維持機房運行。

您還得確定工作人員有足夠的時間休息、並能自家中往返。如果災害規模龐大,影響了工作人員的家庭,那您也得空出更多時間,讓他們回去處理自家的災害防護。您可能也需要在備用地點附近,為員工準備住宿:並安排往返交通。

通常派駐備用地點的人員,來自企業中所有部門的人員。這也牽涉到您公司經營遠端備用地點的能力。如果其他部門的人員也要在備用地點工作,那您也得為他們安排住處。

8.3.7. 從備用狀態恢復正常

隨 著日子過去,災害警報終會解除。災害防護計畫也必須納入這個階段的因應措施。新的資料中心應該要包含所有必備的軟硬體;通常就時間來說,這階段並不像災害 剛發生時,具有高急迫性;不過臨時的備用中心每天都在燒錢,所以純就經濟上的考量,應該要盡快從備用中心轉移到新的資料中心才是。

備用中心的最後一份備份,應該要送到新的資料中心去。當資料灌到新硬體裡面之後,所有工作都應該轉移到新資料中心去。

到這為止,備用資料中心就可以解編,所有硬體也該根據計畫歸建。最後,您應該針對計畫的執行成效開檢討會,所有的建議事項與改進措施都應該寫入新版的防護計畫中。

延伸阅读

文章来源于领测软件测试网 https://www.ltesting.net/


关于领测软件测试网 | 领测软件测试网合作伙伴 | 广告服务 | 投稿指南 | 联系我们 | 网站地图 | 友情链接
版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备10010545号-5
技术支持和业务联系:info@testage.com.cn 电话:010-51297073

软件测试 | 领测国际ISTQBISTQB官网TMMiTMMi认证国际软件测试工程师认证领测软件测试网