開發 BCP 時最常見的 11 個錯誤

開發 BCP 時最常見的 11 個錯誤

大家好,我叫 Igor Tyukachev,是一名業務連續性顧問。 在今天的文章中,我們將就常見真理進行漫長而乏味的討論,我想分享我的經驗,並談談公司在製定業務連續性計劃時犯的主要錯誤。

1.RTO和RPO隨機

我見過的最重要的錯誤是憑空獲取恢復時間(RTO)。 嗯,憑空而來 - 例如,有人從以前的工作地點帶來了兩年前的 SLA 中的一些數字。 他們為什麼要這樣做呢? 畢竟,根據所有方法,您必須先分析對業務流程的後果,並基於此分析計算目標恢復時間和可接受的資料遺失。 但進行這樣的分析有時需要很長時間,有時成本高昂,有時不太清楚如何進行——強調需要做什麼。 很多人首先想到的是: 「我們都是成年人,都知道商業是如何運作的。 我們不要浪費時間和金錢! 讓我們以應有的方式加上或減去。 用無產階級的聰明才智,從你的腦袋裡出來! 讓 RTO 為兩個小時。”

這會導致什麼? 當您向管理層尋求資金開展活動以確保達到一定數量的 RTO/RPO 時,總是需要理由。 如果沒有正當理由,那麼問題就來了:你從哪裡得到它? 並且沒有什麼可以回答的。 結果,你對工作失去了信心。

此外,有時這兩小時的恢復成本就高達一百萬美元。 證明 RTO 持續時間的合理性是一個金錢問題,而且是一個非常大的問題。

最後,當你把你的BCP 和/或DR 計劃帶給表演者(他們在事故發生時實際上正在跑步並揮舞著手臂)時,他們會問一個類似的問題:這兩個小時是從哪裡來的? 如果你不能清楚地解釋這一點,那麼他們將不會對你或你的文件有信心。

結果是為了一張紙而一張紙,取消訂閱。 順便說一句,有些人故意這樣做,只是為了滿足監管機構的要求。

開發 BCP 時最常見的 11 個錯誤
好吧,你明白了

2.包治百病的良藥

有些人認為,制定 BCP 計劃是為了保護所有業務流程免受任何威脅。 最近,「我們要保護自己免受什麼侵害?」這個問題。 我聽到的答案是:“一切,甚至更多。”

開發 BCP 時最常見的 11 個錯誤

但事實是該計劃的目的只是為了保護 具體的 公司的關鍵業務流程來自 具體的 威脅。 因此,在製定計劃之前,有必要評估風險的發生並分析其對業務的影響。 為了了解公司害怕哪些威脅,需要進行風險評估。 如果建築物被摧毀,將有一個連續性計劃,如果有製裁壓力,則有另一個連續性計劃,如果發生洪水,則有第三個連續性計劃。 即使是不同城市的兩個相同地點也可能有截然不同的規劃。

僅用一個 BCP 來保護整個公司是不可能的,尤其是大型 BCP。 例如,龐大的 X5 Retail Group 開始確保兩個關鍵業務流程的連續性(我們寫過這個 這裡)。 而將整個公司納入一個計劃是不切實際的;這是「集體責任」的範疇,每個人都有責任,而沒有人負責。

ISO 22301 標準包含政策的概念,事實上,公司的連續性流程就是從這個概念開始的。 它描述了我們將保護什麼以及免受什麼侵害。 如果人們跑過來要求添加這個那個,例如:

— 讓我們在 BCP 中加入被駭客攻擊的風險嗎?

— 最近下雨,我們的頂樓被水淹了,我們來增加一個場景,如果發生水災怎麼辦?

然後立即向他們推薦這項政策,並說我們保護特定的公司資產,並且僅免受特定的、預先商定的威脅,因為它們是現在的首要任務。

即使更改建議確實合適,也要在下一版的政策中考慮這些建議。 因為保護一家公司需要花很多錢。 因此BCP計畫的所有變更都必須經過預算委員會和規劃。 我們建議每年一次或在公司結構或外部條件發生重大變化後立即審查公司的業務連續性政策(請讀者原諒我這樣說)。

3. 幻想與現實

在製定 BCP 計劃時,作者經常描述一些理想的世界圖景。 例如,“我們沒有第二個資料中心,但我們會像有第二個資料中心一樣編寫計劃。” 或者企業還沒有某些基礎設施,但員工仍然會將其添加到計劃中,希望它將來會出現。 然後公司將把現實延伸到計畫中:建立第二個資料中心,描述其他變化。

開發 BCP 時最常見的 11 個錯誤
左邊是BCP對應的基礎設施,右邊是真正的基礎設施

這都是一個錯誤。 寫BCP計畫就意味著要花錢。 如果你寫的計劃目前不起作用,你將支付非常昂貴的紙張費用。 不可能從中恢復,也不可能對其進行測試。 事實證明,這是為了工作而工作。
您可以很快地制定計劃,但建立備份基礎設施並在所有保護解決方案上花錢是漫長且昂貴的。 這可能需要一年以上的時間。 事實可能是你已經有了一個計劃,並且它的基礎設施將在兩年內出現。 為什麼需要這樣一個計劃? 它會保護你免受什麼侵害?

當 BCP 開發團隊開始為專家弄清楚他們應該做什麼以及在什麼時間做什麼時,這也是一個幻想。 它來自這樣的類別:「當你在針葉林中看到熊時,你需要轉向與熊相反的方向,並以超過熊的速度奔跑。 在冬季,你需要掩蓋自己的蹤跡。”

4. 頂部和根部

第四個最重要的錯誤是計劃要么太膚淺,要么太詳細。 我們需要一個中庸之道。 對於白痴來說,計劃不應該太詳細,但也不應該太籠統,以免出現這樣的結果:

開發 BCP 時最常見的 11 個錯誤
總的來說很容易

5. 對凱撒來說,什麼是凱撒的,對機械師來說,什麼是機械師的。

下一個錯誤源自於上一個錯誤:一個計畫無法容納各級管理階層的所有行動。 BCP計劃通常是為資金流量大的大公司製定的(順便說一句,根據我們的數據) 研究平均而言,48%的俄羅斯大型企業遇到了導致重大財務損失的緊急情況)和多層級管理系統。 對於這樣的公司來說,不值得嘗試將所有內容放入一份文件中。 如果公司規模龐大且結構合理,那麼該計劃應該分為三個不同的層次:

  • 策略層面-高階管理層;
  • 戰術層面-針對中階管理人員;
  • 以及操作層面——對於那些直接參與該領域的人。

例如,如果我們正在談論恢復故障的基礎設施,那麼在戰略層面上會做出激活恢復計劃的決定,在戰術層面上可能會描述過程程序,而在操作層面上會有調試特定的說明。設備件。

開發 BCP 時最常見的 11 個錯誤
無預算的 BCP

每個人都看到自己的職責範圍以及與其他員工的連結。 事故發生的那一刻,每個人都制定了計劃,迅速找到自己的部分並執行。 理想情況下,您需要記住要打開哪些頁面,因為有時分鐘很重要。

6. 角色扮演

制定 BCP 計畫時的另一個錯誤是:計畫中不需要包含具體姓名、電子郵件地址和其他聯絡資訊。 在文件本身的文本中,僅應指出非個人角色,並且應為這些角色分配負責特定任務的人員的姓名,並且應在計劃的附件中列出他們的聯絡資訊。

為什麼呢?

如今,大多數人每兩到三年就會換工作一次。 如果你在計畫的文本中寫下所有責任人和他們的聯絡方式,那麼它就必須不斷地改變。 在大公司,尤其是政府公司,對任何文件的每次更改都需要大量批准。

更不用說,如果發生緊急情況,你必須瘋狂地翻閱計劃並尋找合適的聯絡人,你將浪費寶貴的時間。

生活小技巧:當您更改應用程式時,通常甚至不需要批准它。 另一個提示:您可以使用計劃更新自動化系統。

7. 缺乏版本控制

通常他們會建立一個計劃版本 1.0,然後在不進行編輯模式的情況下進行所有更改,並且不更改檔案名稱。 同時,與先前的版本相比,通常不清楚發生了什麼變化。 在沒有版本控制的情況下,計劃有自己的生命週期,不會以任何方式進行追蹤。 任何 BCP 計劃的第二頁都應標明版本、更改的作者以及更改本身的清單。

開發 BCP 時最常見的 11 個錯誤
沒有人能再弄清楚

8. 我該問誰?

公司通常沒有專人負責 BCP 計劃,也沒有單獨的部門負責業務連續性。 這個光榮的責任被分配給CIO,他的副手,或按照「你處理資訊安全,所以這裡還有BCP」的原則。 因此,該計劃是從上到下制定、商定和批准的。

誰負責儲存計劃、更新和修改其中的資訊? 這可能沒有規定。 為此僱用一名單獨的員工是浪費的,但是當然可以讓現有的一名員工承擔額外的職責,因為現在每個人都在努力提高效率:「讓我們在他身上掛一盞燈籠,這樣他就可以在晚上割草了”,但有必要嗎?
開發 BCP 時最常見的 11 個錯誤
BCP 創建兩年後,我們正在尋找負責人

因此,經常會發生這樣的情況:制定了一個計劃,放在一個長盒子裡,變得佈滿灰塵。 沒有人測試它或維持其相關性。 找客戶最常聽到的一句話就是:“有方案,但是很久以前製定的,是否測試過未知,有行不通的嫌疑。”

9.水太多

有些計畫的介紹長達五頁,包括對先決條件的描述、對專案所有參與者的感謝,以及有關公司業務的資訊。 當你向下滾動到第十頁時,那裡有有用的信息,你的資料中心已經被淹沒了。

開發 BCP 時最常見的 11 個錯誤
當您嘗試閱讀最新資訊時,如果您的資料中心被淹沒,您該怎麼辦?

將所有公司“水”放在單獨的文檔中。 計劃本身必須非常具體:負責這項任務的人執行此操作,等等。

10. 宴會費用由誰負擔?

通常,計劃制定者得不到公司高階主管的支持。 但中階管理人員提供支持,他們不管理或沒有必要的預算和資源來管理業務連續性。 例如,IT 部門在其預算範圍內制定了 BCP 計劃,但 CIO 卻看不到公司的整體情況。 我最喜歡的例子是視訊會議。 當CEO的視訊會議不起作用時,他會剔除誰? 「沒有提供」的 CIO。 因此,從CIO的角度來看,公司最重要的事情是什麼? 人們總是「喜歡」他的原因:視訊會議,它立即變成一個關鍵業務系統。 從商業角度來看 - 好吧,沒有 VKS,想想看,我們會透過電話交談,就像勃列日涅夫領導下的那樣...

此外,IT部門通常認為災難發生時其主要任務是恢復企業IT系統的運作。 但有時你不需要這樣做! 如果有一個業務流程是在非常昂貴的印表機上列印紙張,那麼您不應該購買第二台這樣的印表機作為備用,並將其放在旁邊以防發生故障。 暫時用手為紙片上色可能就夠了。

如果我們要在 IT 內部建立持續的保護,我們必須爭取高階管理層和業務代表的支持。 否則,在 IT 部門內部化身後,您可以解決一定範圍的問題,但不能解決所有必要的問題。

開發 BCP 時最常見的 11 個錯誤
這就是只有 IT 部門有災難復原計畫時的情況

10. 沒有測試

如果有計劃,就需要進行測試。 對於那些不熟悉標準的人來說,這一點並不明顯。 例如,到處都掛著「緊急出口」標誌。 但請告訴我,你的消防桶、鉤子和鏟子在哪裡? 消防栓在哪裡? 滅火器應該安裝在哪裡? 但每個人都應該知道這一點。 對我們來說,進入辦公室時找到滅火器似乎根本不合邏輯。

也許計劃本身應該提到測試計劃的必要性,但這是一個有爭議的決定。 無論如何,一個計劃只有經過至少一次測試才能被認為是有效的。 正如上面提到的,我經常聽到:「有一個計劃,所有的基礎設施都準備好了,但事實並非一切都會按照計劃中所寫的那樣進行。 因為他們沒有測試過。 絕不」。

總之

一些公司可以分析他們的歷史記錄,以了解可能發生什麼樣的麻煩以及發生的可能性有多大。 研究和經驗表明,我們無法保護自己免受一切侵害。 狗屎,任何公司遲早都會發生。 另一件事是您將如何應對這種或類似的情況,以及您是否能夠及時恢復業務。

有些人認為連續性是如何消除各種風險,使其不至於出現。 不,關鍵是風險將會成為現實,而我們將為此做好準備。 士兵們接受的訓練不是在戰鬥中思考,而是行動。 BCP 計劃也是如此:它可以讓您盡快恢復業務。

開發 BCP 時最常見的 11 個錯誤
唯一不需要BCP的設備

伊戈爾·秋卡喬夫,
業務連續性顧問
計算系統設計中心
“噴射資訊系統”


來源: www.habr.com

添加評論