たずえ措氎であっおも、1Cは機胜するはずです DR に関するビゞネスに同意したす

想像しおみおください。あなたは倧芏暡なショッピング センタヌの IT むンフラストラクチャにサヌビスを提䟛しおいるずしたす。街に雚が降り始める。雚が屋根を突き砎り、小売店の敷地内が足銖たでの深さたで氎で満たされたす。サヌバヌ ルヌムが地䞋にないこずを願っおいたす。そうでない堎合、問題は避けられたせん。  

説明されおいる物語はファンタゞヌではなく、2020 幎のいく぀かの出来事をたずめお説明したものです。倧䌁業では、この堎合に備えお灜害埩旧蚈画 (DRP) が垞に甚意されおいたす。䌁業では、これは事業継続専門家の責任です。しかし、䞭小䌁業では、このような問題の解決は IT サヌビスにかかっおいたす。ビゞネス ロゞックを自分で理解し、䜕がどこで倱敗する可胜性があるかを理解し、保護を考え出しお実装する必芁がありたす。 

IT スペシャリストが䌁業ず亀枉し、保護の必芁性に぀いお話し合うこずができれば玠晎らしいこずです。しかし、私は、䌁業が灜害埩旧 (DR) ゜リュヌションを冗長であるず考えお、その゜リュヌションを軜芖した様子を䜕床も芋おきたした。事故が発生するず、回埩に時間がかかり損倱が発生する恐れがあり、事業の準備が敎っおいたせんでした。 「蚀ったでしょ」ず奜きなだけ繰り返すこずができたすが、それでも IT サヌビスはサヌビスを埩元する必芁がありたす。

たずえ措氎であっおも、1Cは機胜するはずです DR に関するビゞネスに同意したす

建築家の立堎から、この状況を回避する方法を説明したす。蚘事の最初の郚分では、準備䜜業、぀たりセキュリティ ツヌルを遞択する際の 3 ぀の質問に぀いおお客様ず話し合う方法に぀いお説明したす。 

  • 私たちは䜕を守っおいるのでしょうか
  • 私たちは䜕から守っおいるのでしょうか
  • 私たちはどこたで守るのでしょうか 

埌半では、自分自身を守る方法ずいう質問に答えるための遞択肢に぀いお話したす。さたざたな顧客がどのように保護を構築するかの䟋を瀺したす。

私たちが守るもの: 重芁なビゞネス機胜の特定 

䌁業顧客ず緊急事態埌の行動蚈画に぀いお話し合うこずから準備を始めるこずをお勧めしたす。ここでの䞻な困難は、共通蚀語を芋぀けるこずです。通垞、顧客は IT ゜リュヌションがどのように機胜するかを気にしたせん。圌は、サヌビスがビゞネス機胜を実行し、収益をもたらすこずができるかどうかを気にしおいたす。たずえば、サむトは機胜しおいるが、支払いシステムがダりンし、クラむアントからの収入がなく、「過激掟」は䟝然ずしお IT スペシャリストである堎合です。 

IT プロフェッショナルは、次のような理由から、このような亀枉が難しい堎合がありたす。

  • IT サヌビスは、ビゞネスにおける情報システムの圹割を完党には理解しおいたせん。たずえば、ビゞネス プロセスや透明性のあるビゞネス モデルの説明が利甚できない堎合です。 
  • プロセス党䜓が IT サヌビスに䟝存しおいるわけではありたせん。たずえば、䜜業の䞀郚が請負業者によっお実行され、IT 専門家が請負業者に盎接圱響を及がさない堎合などです。

私なら䌚話を次のように構成したす。 

  1. 事故は誰にでも起こり、埩旧には時間がかかるこずを事業者に説明しおいたす。最善のこずは、状況、これがどのように起こり、どのような結果が起こり埗るかを瀺すこずです。
  2. すべおが IT サヌビスに䟝存しおいるわけではありたせんが、自分の責任分野でのアクション プランを支揎する準備ができおいるこずを瀺したす。
  3. 私たちは䌁業顧客に、「黙瀺録が起こった堎合、どのプロセスを最初に埩元する必芁があるか?」ず答えおもらいたす。誰がどのように参加するのでしょうか? 

    たずえば、コヌルセンタヌはアプリケヌションを 24 時間幎䞭無䌑で登録し続ける必芁があるなど、䌁業からは簡単な回答が求められたす。

  4. システムのナヌザヌ 1 人たたは 2 人に、このプロセスを詳しく説明しおもらいたす。 
    䌚瀟にアナリストがいる堎合は、アナリストに協力しおもらうこずをお勧めしたす。

    たず、説明は次のようになりたす。コヌルセンタヌは、電話、メヌル、Web サむトからのメッセヌゞを通じおリク゚ストを受け取りたす。次に、Web むンタヌフェむスを介しおそれらを 1C に入力し、本番環境がこの方法でそこからそれらを取埗したす。

  5. 次に、そのプロセスをサポヌトするハヌドりェアおよび゜フトりェア ゜リュヌションを怜蚎したす。包括的な保護のために、次の 3 ぀のレベルが考慮されたす。 
    • サむト内のアプリケヌションずシステム (゜フトりェア レベル)、   
    • システムが実行されるサむト自䜓 (むンフラストラクチャ レベル)、 
    • ネットワヌク圌らはしばしばそれを忘れたす。

  6. 朜圚的な障害点、぀たりサヌビス運甚が䟝存するシステムノヌドを特定したす。たた、通信事業者などの他瀟がサポヌトするノヌドも特定したす。 ホスティングプロバむダヌ、デヌタセンタヌなどです。これを念頭に眮き、ビゞネス顧客に戻っお次のステップに進みたす。

私たちが守るもの: リスク

次に、最初にどのようなリスクから身を守るかを䌁業顧客から聞き出したす。すべおのリスクは 2 ぀のグルヌプに分類できたす。 

  • サヌビスのダりンタむムによる時間の損倱。
  • 物理的衝撃や人的芁因などによるデヌタの損倱。

䌁業はデヌタず時間の䞡方を倱うこずを恐れおいたす。これはすべお金銭の損倱に぀ながりたす。そこで、それぞれのリスクグルヌプに぀いお再床質問したす。 

  • このプロセスで、デヌタ損倱ず時間損倱がどれくらいの金額になるかを芋積もるこずはできたすか? 
  • 倱われないデヌタは䜕ですか? 
  • ダりンタむムを蚱容できないのはどこでしょうか? 
  • 私たちにずっお最も可胜性が高く、最も脅嚁ずなる出来事は䜕ですか?

ディスカッションの埌、障害ポむントの優先順䜍を決定する方法がわかりたす。 

どれだけ保護するか: RPO ず RTO 

重倧な障害点が明確になったら、RTO 指暙ず RPO 指暙を蚈算したす。 

私がいるこずを思い出す RTO (目暙埩旧時間) — これは、事故の瞬間からサヌビスが完党に埩旧するたでの蚱容時間です。ビゞネス甚語では、これは蚱容できるダりンタむムです。プロセスによっおもたらされた金額がわかれば、ダりンタむムごずに損倱を蚈算し、蚱容可胜な損倱を蚈算できたす。 

RPO (目暙埩旧時点) — 有効なデヌタ回埩ポむント。デヌタが倱われる可胜性がある期間が決たりたす。ビゞネスの芳点から芋るず、デヌタ損倱は眰金などに぀ながる可胜性がありたす。このような損倱はお金に換算するこずもできたす。 

たずえ措氎であっおも、1Cは機胜するはずです DR に関するビゞネスに同意したす

゚ンド ナヌザヌがシステムにログむンできるたでの時間を蚈算する必芁がありたす。そこで、たずチェヌン内のすべおのリンクの回埩時間を合蚈したす。ここでよくある間違いは、SLA からプロバむダヌの RTO を取り䞊げ、残りの条件を無芖するこずです。

具䜓的な䟋を芋おみたしょう。ナヌザヌが 1C にログむンするず、システムが開き、デヌタベヌス ゚ラヌが発生したす。圌はシステム管理者に連絡したす。デヌタベヌスはクラりドにあり、システム管理者は問題をサヌビス プロバむダヌに報告したす。すべおの通信に 15 分かかるずしたす。クラりドでは、このサむズのデヌタ​​ベヌスはバックアップから 15 時間で埩元されるため、サヌビス プロバむダヌ偎​​の RTO は XNUMX 時間になりたす。ただし、これはナヌザヌにずっおの最終期限ではなく、問題を怜出するために XNUMX 分が远加されたす。 
 
次に、システム管理者はデヌタベヌスが正しいこずを確認し、デヌタベヌスを 1C に接続しおサヌビスを開始する必芁がありたす。これにはさらに 2 時間かかりたす。぀たり、管理者偎の RTO はすでに 15 時間 15 分になっおいたす。ナヌザヌにはさらに 2 分かかりたす。ログむンしお、必芁なトランザクションが衚瀺されおいるこずを確認したす。この䟋では、サヌビスの合蚈埩旧時間は 30 時間 XNUMX 分です。

これらの蚈算により、ビゞネスが回埩期間がどのような倖郚芁因に䟝存するかがわかりたす。たずえば、オフィスが浞氎した堎合、たず挏氎箇所を芋぀けお修理する必芁がありたす。 ITに䟝存しない時間はかかりたす。  

保護方法: さたざたなリスクに察応するツヌルの遞択

すべおの点に぀いお話し合った埌、顧客はすでに䌁業にずっおの事故のコストを理解しおいたす。これで、ツヌルを遞択し、予算に぀いお話し合うこずができたす。お客様の事䟋をもずに、さたざたな業務に合わせお圓瀟が提䟛するツヌルをご玹介したす。 

最初のグルヌプのリスク、぀たりサヌビスのダりンタむムによる損倱から始めたしょう。この問題の解決策は、良奜な RTO を提䟛する必芁がありたす。

  1. クラりドでアプリケヌションをホストする 

    たず、単玔にクラりドに移行できたす。プロバむダヌは高可甚性の問題をすでに怜蚎しおいたす。仮想化ホストはクラスタヌに組み立おられ、電力ずネットワヌクは予玄され、デヌタはフォヌルト トレラント ストレヌゞ システムに保存され、サヌビス プロバむダヌがダりンタむムに察する経枈的責任を負いたす。

    たずえば、クラりド内のデヌタベヌスを備えた仮想マシンをホストできたす。アプリケヌションは、確立されたチャネルを介しお倖郚から、たたは同じクラりドからデヌタベヌスに接続したす。クラスタヌ内のいずれかのサヌバヌで問題が発生した堎合、VM は 2 分以内に隣接するサヌバヌで再起動したす。その埌、DBMS が起動し、数分でデヌタベヌスが䜿甚可胜になりたす。

    RTO: 分単䜍で枬定されたす。これらの条件はプロバむダヌずの契玄で指定できたす。
    のコスト: アプリケヌションのクラりド リ゜ヌスのコストを蚈算したす。 
    それがあなたを守っおくれないもの: 郜垂レベルでの事故などによる、プロバむダヌのサむトでの倧芏暡な障害によるもの。

  2. アプリケヌションをクラスタヌ化する  

    RTO を改善したい堎合は、前のオプションを匷化しお、クラスタヌ化されたアプリケヌションをすぐにクラりドに配眮できたす。

    クラスタヌはアクティブ/パッシブ モヌドたたはアクティブ/アクティブ モヌドで実装できたす。ベンダヌの芁件に基づいお耇数の VM を䜜成したす。信頌性を高めるために、それらをさたざたなサヌバヌずストレヌゞ システムに分散させたす。いずれかのデヌタベヌスを備えたサヌバヌに障害が発生した堎合、バックアップ ノヌドが数秒以内に負荷を匕き継ぎたす。

    RTO: 秒単䜍で枬定されたす。
    のコスト: 通垞のクラりドよりわずかに高䟡であり、クラスタリングには远加のリ゜ヌスが必芁になりたす。
    それがあなたを守っおくれないもの: それでも、オンサむトの倧芏暡な障害からは保護されたせん。しかし、局地的な混乱はそれほど長くは続かないでしょう。

    緎習から: この小売䌚瀟は、いく぀かの情報システムず Web サむトを持っおいたした。すべおのデヌタベヌスは䌚瀟のオフィス内のロヌカルに配眮されたした。オフィスが数回連続しお停電になるたで、DR に぀いおは考えられたせんでした。顧客はりェブサむトのクラッシュに䞍満を抱いおいたした。 
     
    サヌビスの可甚性の問題は、クラりドに移行したこずで解決されたした。さらに、ノヌド間のトラフィックのバランスをずるこずで、デヌタベヌスの負荷を最適化するこずができたした。

  3. 灜害に匷いクラりドぞの移行

    メむン サむトで自然灜害が発生しおも業務に支障をきたさないようにする必芁がある堎合は、このオプションでは、プロバむダヌが仮想化クラスタヌを 2 ぀のデヌタ センタヌに分散させたす。デヌタセンタヌ間で XNUMX 察 XNUMX で垞時同期レプリケヌションが行われたす。デヌタセンタヌ間のチャネルは予玄されおおり、異なるルヌトに沿っお移動するため、このようなクラスタヌではネットワヌクの問題を心配する必芁はありたせん。 

    RTO0になる傟向がありたす。
    のコスト: 最も高䟡なクラりド オプション。 
    それがあなたを守っおくれないもの: デヌタ砎損や人的芁因による圱響は避けられないため、バックアップも同時に䜜成するこずをお勧めしたす。 

    緎習から: 圓瀟のクラむアントの 1 ぀は、包括的な灜害埩旧蚈画を策定したした。圌が遞んだ戊略は次のずおりです。 

    • 灜害に匷いクラりドは、むンフラストラクチャ レベルでの障害からアプリケヌションを保護したす。 
    • 2 レベルのバックアップにより、人的゚ラヌが発生した堎合に保護が提䟛されたす。バックアップには「コヌルド」ず「ホット」の 2 皮類がありたす。 「コヌルド」バックアップは無効な状態にあるため、展開に時間がかかりたす。 「ホット」バックアップはすでに䜿甚できる状態になっおおり、より速く埩元されたす。特別に専甚のストレヌゞ システムに保存されたす。 3 番目のコピヌはテヌプに蚘録され、別の郚屋に保管されたす。 

    クラむアントは週に 1 回、保護をテストし、テヌプからのバックアップを含むすべおのバックアップの機胜をチェックしたす。同瀟は毎幎、灜害に匷いクラりド党䜓をテストしおいたす。 

  4. 別のサむトぞのレプリケヌションを敎理する 

    メむン サむトでのグロヌバルな問題を回避する方法に関するもう 1 ぀のオプションは、地理的予玄を提䟛するこずです。぀たり、別の郜垂のサむトにバックアップ仮想マシンを䜜成したす。これには、DR 甚の特別な゜リュヌションが適しおいたす。圓瀟では VMware vCloud Availability (vCAV) を䜿甚しおいたす。これを利甚するず、耇数のクラりド プロバむダヌ サむト間で保護を構成したり、オンプレミス サむトからクラりドに埩元したりできたす。 vCAV を䜿甚するスキヌムに぀いおはすでに詳しく説明したした。 ここで

    RPO ず RTO5分から。 

    のコスト: 最初のオプションより高䟡ですが、灜害に匷いクラりドでのハヌドりェア レプリケヌションよりは安䟡です。䟡栌は、vCAV ラむセンスのコスト、管理料金、クラりド リ゜ヌスのコスト、および PAYG モデルに基づく予玄リ゜ヌス (スむッチオフされた VM の䜜業リ゜ヌスのコストの 10%) で構成されたす。

    緎習から: クラむアントは、モスクワにある圓瀟のクラりドに、異なるデヌタベヌスを持぀ 6 台の仮想マシンを保持しおいたした。圓初、保護はバックアップによっお提䟛されおいたした。バックアップ コピヌの䞀郚はモスクワのクラりドに保存され、䞀郚はサンクトペテルブルクのサむトに保存されたした。時間の経過ずずもにデヌタベヌスのサむズが倧きくなり、バックアップからの埩元に時間がかかるようになりたした。 
     
    VMware vCloud Availability に基づくレプリケヌションがバックアップに远加されたした。仮想マシンのレプリカはサンクトペテルブルクのバックアップ サむトに保存され、5 分ごずに曎新されたす。メむン サむトで障害が発生した堎合、埓業員は独自にサンクトペテルブルクにある仮想マシンのレプリカに切り替えお䜜業を続けたす。 

怜蚎されおいるすべおの゜リュヌションは高可甚性を提䟛したすが、ランサムりェア りむルスや埓業員の偶発的なミスによるデヌタ損倱を防ぐこずはできたせん。この堎合、必芁な RPO を提䟛するバックアップが必芁になりたす。

5. バックアップを忘れないでください

たずえ最も優れた耐灜害゜リュヌションを持っおいたずしおも、バックアップを䜜成する必芁があるこずは誰もが知っおいたす。そこで、いく぀かのポむントを簡単に思い出させおいただきたす。

厳密に蚀えば、バックアップは DR ではありたせん。だからこそ: 

  • 久しぶり。デヌタがテラバむト単䜍である堎合、回埩には 1 時間以䞊かかりたす。埩元し、ネットワヌクを割り圓お、電源が入っおいるこずを確認し、デヌタが正垞であるこずを確認する必芁がありたす。したがっお、デヌタが少ない堎合にのみ、良奜な RTO を提䟛できたす。 
  • デヌタは最初は埩元できない可胜性があるため、アクションを繰り返す時間を考慮する必芁がありたす。たずえば、デヌタがい぀倱われたのか正確にわからない堎合がありたす。玛倱が 15.00 時に認識され、コピヌが 15.00 時間ごずに䜜成されたずしたす。 14:00 から、13:00、XNUMX:XNUMX などのすべおの回埩ポむントを調べたす。システムが重芁な堎合、埩旧ポむントの経過期間を最小限に抑えるよう努めたす。ただし、新しいバックアップに必芁なデヌタが含たれおいない堎合は、次の点に進みたす。これには远加の時間がかかりたす。 

この堎合、バックアップ スケゞュヌルは必芁なスケゞュヌルを提䟛できたす。 RPO。バックアップの堎合は、メむン サむトに問題が発生した堎合に備えお地理的予玄を提䟛するこずが重芁です。いく぀かのバックアップ コピヌを個別に保存するこずをお勧めしたす。

最終的な灜害埩旧蚈画には、少なくずも 2 ぀のツヌルが含たれおいる必芁がありたす。  

  • オプション 1  4 の XNUMX ぀。システムを障害や萜䞋から保護したす。
  • デヌタを損倱から守るためのバックアップ。 

䞻芁なむンタヌネットプロバむダヌがダりンした堎合に備えお、バックアップ通信チャネルを甚意しおおくこずも䟡倀がありたす。そしお、出来䞊がり —最䜎賃金でのDRはすでに準備が敎っおいたす。 

出所 habr.com

DDoS 保護機胜を備えた信頌性の高いサむト甚ホスティング、VPS VDS サヌバヌを賌入する 🔥 DDoS攻撃察策付きの信頌性の高いりェブサむトホスティング、VPS/VDSサヌバヌを賌入したしょう | ProHoster