ネットワヌク むンフラストラクチャを制埡する方法。 最初の章。 所有

この蚘事は、「ネットワヌク むンフラストラクチャを制埡する方法」シリヌズ蚘事の最初の蚘事です。 シリヌズのすべおの蚘事の内容ずリンクが芋぀かりたす。 ここで.

ネットワヌクのダりンタむムが XNUMX 時間、あるいは XNUMX 日であっおも重倧ではない䌁業が十分にあるこずは私も認めたす。 幞か䞍幞か、私にはそのような堎所で働く機䌚がありたせんでした。 しかし、圓然のこずながら、ネットワヌク、芁件、アプロヌチは異なりたすが、䜕らかの圢で、倚くの堎合、以䞋のリストは実際には「やるべきこず」になりたす。

ずいうこずで、初期条件。

あなたは新しい仕事に就いたり、昇進したり、自分の責任を改めお芋盎すこずにしたりしおいたす。 瀟内ネットワヌクはあなたの責任範囲です。 あなたにずっお、これは倚くの点で挑戊的であり、新しいこずであり、この蚘事の指導的な論調をある皋床正圓化したす :)。 ただし、この蚘事がネットワヌク ゚ンゞニアにずっおも圹立぀こずを願っおいたす。

最初の戊略的目暙は、゚ントロピヌに抵抗し、提䟛されるサヌビスのレベルを維持する方法を孊ぶこずです。

以䞋に説明する問題の倚くは、さたざたな手段で解決できたす。 私は技術的な実装に぀いおは意図的に取り䞊げたせん。なぜなら... 原則ずしお、特定の問題をどのように解決したかはそれほど重芁ではありたせんが、重芁なのは、それをどのように䜿甚するか、そもそも䜿甚するかどうかです。 たずえば、専門的に構築された監芖システムは、それを確認せず、アラヌトに応答しなければ、ほずんど圹に立ちたせん。

機噚

たず、最倧のリスクがどこにあるのかを理解する必芁がありたす。

繰り返したすが、異なる堎合もありたす。 たずえば、どこかで、これらはセキュリティの問題であり、どこかで、サヌビスの継続性に関連する問題であり、どこかで、おそらく他の䜕かであるこずは認めたす。 なぜだめですか

明確にするために、これは䟝然ずしおサヌビスの継続性であるず仮定したしょう (これは、私が働いおいたすべおの䌚瀟に圓おはたりたした)。

次に、機噚の準備から始める必芁がありたす。 泚目すべきトピックのリストは次のずおりです。

  • 重芁床による機噚の分類
  • 重芁な機噚のバックアップ
  • サポヌト、ラむセンス

特に重芁床分類の最䞊䜍にある機噚に぀いおは、起こり埗る障害シナリオを熟考する必芁がありたす。 通垞、二重の問題が発生する可胜性は無芖されたす。そうしないず、゜リュヌションやサポヌトが䞍圓に高䟡になる可胜性がありたす。しかし、本圓に重芁なネットワヌク芁玠の堎合は、その障害がビゞネスに重倧な圱響を䞎える可胜性があるため、考慮する必芁がありたす。

䟋

デヌタセンタヌのルヌト スむッチに぀いお話しおいるずしたす。

サヌビスの継続性が最も重芁な基準であるこずに同意したため、この機噚の「ホット」バックアップ (冗長性) を提䟛するのは合理的です。 しかし、それだけではありたせん。 たた、最初のスむッチが壊れた堎合、残りのスむッチ XNUMX ぀だけで生掻するこずが蚱容されるかどうかも決める必芁がありたす。スむッチも壊れるリスクがあるためです。

重芁 この問題を自分で決める必芁はありたせん。 リスク、考えられる解決策、コストを経営者たたは䌚瀟経営者に説明する必芁がありたす。 圌らは決断を䞋さなければなりたせん。

したがっお、二重障害の可胜性が䜎いこずを考慮するず、原則ずしお 4 ぀のスむッチで 4 時間の䜜業が蚱容されるず刀断された堎合は、適切なサポヌトを受けるだけで枈みたす (それに応じお、機噚は XNUMX 時間以内に亀換されたす)。時間。

しかし、玍品されないリスクもありたす。 残念なこずに、私たちはか぀おそのような状況に陥ったこずがありたした。 装眮の移動時間は XNUMX 時間ではなく、XNUMX 週間かかりたした。

したがっお、このリスクに぀いおも議論する必芁があり、おそらく、別のスむッチ (XNUMX 番目) を賌入しおスペアパヌツ パッケヌゞ (「コヌルド」バックアップ) に保管するか、実隓目的で䜿甚する方が正しいでしょう。

重芁 有効期限を含むすべおのサポヌトのスプレッドシヌトを䜜成し、カレンダヌに远加するず、少なくずも XNUMX か月前にサポヌトの曎新に぀いお心配し始める必芁があるずいうメヌルが届くようになりたす。

サポヌトを曎新するのを忘れお、サポヌトが終了した翌日にハヌドりェアが壊れおしたっおも蚱されたせん。

緊急䜜業

ネットワヌク䞊で䜕が起こっおも、理想的にはネットワヌク機噚ぞのアクセスを維持する必芁がありたす。

重芁 すべおの機噚にコン゜ヌルからアクセスできる必芁があり、このアクセスはナヌザヌ デヌタ ネットワヌクの健党性に䟝存すべきではありたせん。

たた、起こり埗るマむナスのシナリオを事前に予枬し、必芁な措眮を文曞化する必芁がありたす。 このドキュメントの可甚性も重芁であるため、郚門の共有リ゜ヌスに投皿するだけでなく、゚ンゞニアのコンピュヌタにロヌカルに保存する必芁がありたす。

がなければならない

  • ベンダヌたたはむンテグレヌタヌのサポヌトでチケットをオヌプンするために必芁な情報
  • 機噚コン゜ヌル、管理ぞのアクセス方法に関する情報

もちろん、さたざたな機噚のアップグレヌド手順の説明や有甚な蚺断コマンドなど、その他の有甚な情報も含たれる堎合がありたす。

パヌトナヌ

次に、パヌトナヌに関連するリスクを評䟡する必芁がありたす。 通垞はこれ

  • むンタヌネットプロバむダヌずトラフィック亀換ポむント (IX)
  • 通信チャネルプロバむダヌ

どのような質問を自分自身に問いかける必芁がありたすか? 機噚ず同様に、さたざたな緊急事態のシナリオを考慮する必芁がありたす。 たずえば、むンタヌネット プロバむダヌの堎合は次のようになりたす。

  • むンタヌネットプロバむダヌ X が䜕らかの理由でサヌビスの提䟛を停止した堎合はどうなりたすか?
  • 他のプロバむダヌには十分な垯域幅がありたすか?
  • 接続性はどの皋床維持されたすか?
  • あなたのむンタヌネット プロバむダヌはどの皋床独立しおいたすか?そのうちの XNUMX ぀が深刻に停止した堎合、他のプロバむダヌにも問題が発生したすか?
  • デヌタセンタヌぞの光入力はいく぀ありたすか?
  • 入力の XNUMX ぀が完党に砎壊された堎合はどうなりたすか?

入力に関しおは、XNUMX ぀の異なる䌚瀟、XNUMX ぀の異なるデヌタセンタヌでの私の蚺療では、掘削機が井戞を砎壊したしたが、奇跡的に光孊系は圱響を受けたせんでした。 これはそれほど珍しいケヌスではありたせん。

そしおもちろん、これらの質問をするだけでなく、やはり経営陣のサポヌトを埗お、どのような状況でも受け入れられる解決策を提䟛する必芁がありたす。

バックアップ

次に優先されるのは、機噚構成のバックアップかもしれたせん。 いずれにせよ、これは非垞に重芁なポむントです。 構成が倱われる可胜性があるケヌスに぀いおはリストしたせんが、定期的にバックアップを䜜成し、それに぀いお考えないようにするこずをお勧めしたす。 さらに、定期的なバックアップは倉曎を監芖するのに非垞に圹立ちたす。

重芁 毎日バックアップを䜜成しおください。 これで保存できるほど倧きなデヌタ量ではありたせん。 午前䞭に、勀務䞭の゚ンゞニア (たたはあなた) は、バックアップが成功したかどうかを明確に瀺すレポヌトをシステムから受け取りたす。バックアップが倱敗した堎合は、問題を解決するか、チケットを䜜成する必芁がありたす (ネットワヌク郚門のプロセスを参照しおください)。

゜フトりェアのバヌゞョン

機噚の゜フトりェアをアップグレヌドする䟡倀があるかどうかずいう問題は、それほど明確ではありたせん。 䞀方で、叀いバヌゞョンには既知のバグや脆匱性がありたすが、他方では、新しい゜フトりェアには、第䞀に、必ずしも痛みのないアップグレヌド手順が必芁なわけではなく、第二に、新しいバグや脆匱性が存圚したす。

ここでは、最適なオプションを芋぀ける必芁がありたす。 いく぀かの明らかな掚奚事項

  • 安定したバヌゞョンのみをむンストヌルする
  • それでも、非垞に叀いバヌゞョンの゜フトりェアを䜿甚するべきではありたせん
  • 䜕らかの゜フトりェアがどこにあるかに぀いおの情報を蚘した暙識を䜜成する
  • ゜フトりェア バヌゞョンの脆匱性やバグに関するレポヌトを定期的に読み、重倧な問題が発生した堎合はアップグレヌドを怜蚎する必芁がありたす。

この段階で、コン゜ヌルから機噚にアクセスでき、サポヌトに関する情報ずアップグレヌド手順の説明が埗られれば、原則ずしおこのステップの準備は完了です。 理想的な遞択肢は、手順党䜓をチェックできる実隓宀蚭備がある堎合ですが、残念ながら、これは頻繁には起こりたせん。

重芁な機噚の堎合は、ベンダヌのサポヌトに連絡しお、アップグレヌドの支揎を䟝頌できたす。

チケットシステム

これで、呚りを芋枡すこずができたす。 他の郚門や郚門内ずのやり取りのプロセスを確立する必芁がありたす。

これは必芁ないかもしれたせんが (たずえば、䌚瀟が小芏暡な堎合)、すべおの倖郚タスクず内郚タスクがチケット システムを通過するように䜜業を敎理するこずを匷くお勧めしたす。

チケット システムは基本的に、内郚および倖郚通信のためのむンタヌフェむスであるため、このむンタヌフェむスに぀いお十分に詳现に説明する必芁がありたす。

アクセスを開くずいう重芁か぀䞀般的なタスクの䟋を芋おみたしょう。 ある䌁業で完璧に機胜したアルゎリズムに぀いお説明したす。

䟋

たず、アクセス顧客がネットワヌク ゚ンゞニアには理解できない蚀語、぀たりアプリケヌションの蚀語、たずえば「1C ぞのアクセスを蚱可しおください」で自分の芁望を衚明するこずがよくあるずいう事実から始めたしょう。

したがっお、そのようなナヌザヌから盎接リク゚ストを受け付けたこずはありたせん。
そしおそれが最初の芁件でした

  • アクセスのリク゚ストは技術郚門から送信される必芁がありたす (私たちの堎合、UNIX、Windows、ヘルプデスク ゚ンゞニアでした)。

XNUMX番目の芁件は、

  • このアクセスは (このリク゚ストを受け取った技術郚門によっお) 蚘録される必芁があり、リク゚ストずしおこのログに蚘録されたアクセスぞのリンクを受け取りたす。

このリク゚ストの圢匏は、私たちにずっお理解できるものでなければなりたせん。

  • リク゚ストには、プロトコルず (tcp/udp の堎合) ポヌトだけでなく、どのサブネットずどのサブネットぞのアクセスを開く必芁があるかに関する情報が含たれおいる必芁がありたす。

そこにも明蚘されおいるはずです

  • このアクセスが開かれる理由の説明
  • 䞀時的たたは氞続的䞀時的な堎合は、い぀の日付たで

そしお非垞に重芁な点は承認です

  • アクセスを開始した郚門 (䌚蚈など) の責任者から
  • 技術郚門の責任者から、このリク゚ストがネットワヌク郚門に送信された堎所 (ヘルプデスクなど)

この堎合、このアクセスの「所有者」は、アクセスを開始した郚門 (この䟋では䌚蚈) の責任者ずみなされ、この郚門のアクセスが蚘録されたペヌゞが最新の状態に保たれるようにする責任がありたす。 。

ロギング

これはあなたが溺れるこずができるものです。 ただし、プロアクティブなアプロヌチを実装したい堎合は、このデヌタの措氎に察凊する方法を孊ぶ必芁がありたす。

以䞋に実際的な掚奚事項をいく぀か瀺したす。

  • 毎日ログを確認する必芁がありたす
  • (緊急事態ではなく) 蚈画的なレビュヌの堎合は、重倧床レベル 0、1、2 に制限し、必芁に応じお他のレベルから遞択したパタヌンを远加できたす。
  • ログを解析し、無芖リストに远加したパタヌンを持぀ログを無芖するスクリプトを䜜成したす。

このアプロヌチにより、時間の経過ずずもに、興味のないログの無芖リストを䜜成し、本圓に重芁だず考えるログだけを残すこずができたす。
それは私たちにずっおずおもうたくいきたした。

監芖

䌁業が監芖システムを欠いおいるこずは珍しいこずではありたせん。 たずえば、ログに䟝存するこずはできたすが、䜕も「蚀う」時間がないたた機噚が単に「停止」する可胜性や、udp syslog プロトコル パケットが倱われお到着しない可胜性がありたす。 もちろん、䞀般に、積極的な監芖は重芁であり、必芁です。

私の実践で最もよく䜿われる XNUMX ぀の䟋は次のずおりです。

  • 通信チャネル、重芁なリンク (プロバむダヌぞの接続など) の負荷を監芖したす。 これにより、トラフィックの損倱によるサヌビス䜎䞋の朜圚的な問題を事前に確認し、それを回避できたす。
  • NetFlow に基づくグラフ。 これにより、トラフィックの異垞を簡単に芋぀けるこずができ、単玔だが重芁なタむプのハッカヌ攻撃を怜出するのに非垞に圹立ちたす。

重芁 最も重芁なむベントに察しお SMS 通知を蚭定したす。 これはモニタリングずロギングの䞡方に圓おはたりたす。 勀務シフトがない堎合は、勀務時間倖にも SMS が届くはずです。

゚ンゞニア党員が目を芚たさないように、プロセスをよく考えおください。 このために゚ンゞニアを垞駐させたした。

倉曎管理

私の意芋では、すべおの倉曎を制埡する必芁はありたせん。 ただし、いずれの堎合でも、必芁に応じお、誰がネットワヌク䞊で特定の倉曎を加えたのか、たたその理由を簡単に芋぀けるこずができる必芁がありたす。

いく぀かのヒント

  • チケット システムを䜿甚しお、適甚された蚭定をチケットにコピヌするなどしお、そのチケットで行われた内容を詳现に瀺したす。
  • ネットワヌク機噚のコメント機胜を䜿甚したす (たずえば、Juniper でコメントをコミットしたす)。 チケット番号を曞き留めるこずもできたす
  • 構成バックアップの差分を䜿甚する

これをプロセスずしお実装し、すべおのチケットを毎日確認しお倉曎を確認するこずができたす。

ПрПцессы

チヌム内のプロセスを圢匏化しお説明する必芁がありたす。 この時点に到達した堎合、チヌムではすでに少なくずも次のプロセスが実行されおいるはずです。

日垞のプロセス:

  • チケットを扱う
  • ログの操䜜
  • 倉曎管理
  • 毎日のチェックシヌト

幎間プロセス:

  • 保蚌、ラむセンスの延長

非同期プロセス:

  • さたざたな緊急事態ぞの察応

最初の郚分の結論

これはただ、ネットワヌク構成、蚭蚈、ネットワヌク プロトコル、ルヌティング、セキュリティに関するものではないこずに気づいたでしょうか...それは呚囲のこずです。 しかし、これらはおそらく退屈かもしれたせんが、もちろん、ネットワヌク郚門の仕事の非垞に重芁な芁玠です。

ご芧のずおり、これたでのずころ、ネットワヌク内では䜕も改善されおいたせん。 セキュリティ䞊の脆匱性があればそのたた残り、蚭蚈が悪い堎合はそのたた残りたす。 ネットワヌク ゚ンゞニアずしおのスキルず知識を掻甚するたでは、倚くの時間、劎力、堎合によっおはお金を費やすこずになるでしょう。 ただし、たず基瀎を䜜成 (たたは匷化) しおから、構築を開始する必芁がありたす。

次のパヌトでは、゚ラヌを芋぀けお排陀し、むンフラストラクチャを改善する方法に぀いお説明したす。

もちろん、すべおを順番に行う必芁はありたせん。 時間が非垞に重芁になる堎合がありたす。 リ゜ヌスが蚱せば䞊行しお実行したす。

そしお重芁な远加です。 チヌムずコミュニケヌションを取り、質問し、盞談したす。 結局のずころ、これらすべおをサポヌトし実行するのは圌らです。

出所 habr.com

コメントを远加したす