كيفية التحكم في البنية التحتية لشبكتك. الفصل الأول. يمسك

هذه المقالة هي الأولى في سلسلة مقالات بعنوان "كيفية التحكم في البنية التحتية لشبكتك". يمكن العثور على محتويات جميع المقالات في السلسلة والروابط هنا.

أعترف تمامًا أن هناك عددًا كافيًا من الشركات التي لا يكون فيها تعطل الشبكة لمدة ساعة واحدة أو حتى يوم واحد أمرًا بالغ الأهمية. لسوء الحظ أو لحسن الحظ، لم تتح لي الفرصة للعمل في مثل هذه الأماكن. ولكن بطبيعة الحال، الشبكات مختلفة، والمتطلبات مختلفة، والأساليب مختلفة، ومع ذلك، بشكل أو بآخر، فإن القائمة أدناه في كثير من الحالات ستكون في الواقع "واجبا لا بد منه".

لذلك، الشروط الأولية.

أنت في وظيفة جديدة، أو حصلت على ترقية، أو قررت إلقاء نظرة جديدة على مسؤولياتك. شبكة الشركة هي مجال مسؤوليتك. بالنسبة لك، يعد هذا تحديًا وجديدًا من نواحٍ عديدة، وهو ما يبرر إلى حد ما النبرة الإرشادية لهذه المقالة :). لكنني آمل أن تكون المقالة مفيدة أيضًا لأي مهندس شبكات.

هدفك الاستراتيجي الأول هو تعلم مقاومة الإنتروبيا والحفاظ على مستوى الخدمة المقدمة.

يمكن حل العديد من المشكلات الموضحة أدناه بوسائل مختلفة. أتعمد عدم إثارة موضوع التنفيذ الفني، لأن... من حيث المبدأ، غالبًا ما لا يكون من المهم جدًا كيفية حل هذه المشكلة أو تلك، ولكن المهم هو كيفية استخدامها وما إذا كنت تستخدمها على الإطلاق. على سبيل المثال، لن يكون نظام المراقبة الذي تم تصميمه بشكل احترافي ذا فائدة تذكر إذا لم تنظر إليه ولا تستجيب للتنبيهات.

معدات

تحتاج أولاً إلى فهم أين تكمن أكبر المخاطر.

مرة أخرى، يمكن أن يكون مختلفا. أعترف أنه في مكان ما، على سبيل المثال، ستكون هذه مشكلات أمنية، وفي مكان ما، مشكلات تتعلق باستمرارية الخدمة، وفي مكان ما، ربما شيء آخر. ولم لا؟

لنفترض، لكي نكون واضحين، أن هذا لا يزال استمرارية الخدمة (كان هذا هو الحال في جميع الشركات التي عملت فيها).

ثم عليك أن تبدأ بالمعدات. فيما يلي قائمة بالموضوعات التي يجب الانتباه إليها:

  • تصنيف المعدات حسب درجة الأهمية
  • النسخ الاحتياطي للمعدات الهامة
  • الدعم والتراخيص

أنت بحاجة إلى التفكير في سيناريوهات الفشل المحتملة، خاصة مع المعدات الموجودة في أعلى تصنيف الأهمية الخاص بك. عادة، يتم إهمال احتمال حدوث مشكلات مزدوجة، وإلا فقد يصبح الحل والدعم الخاص بك باهظ الثمن بشكل غير معقول، ولكن في حالة عناصر الشبكة المهمة حقًا، والتي قد يؤثر فشلها بشكل كبير على العمل، يجب عليك التفكير في الأمر.

مثال

لنفترض أننا نتحدث عن مفتاح الجذر في مركز البيانات.

وبما أننا اتفقنا على أن استمرارية الخدمة هي المعيار الأكثر أهمية، فمن المعقول توفير نسخة احتياطية "ساخنة" (التكرار) لهذه المعدات. ولكن هذا ليس كل شيء. تحتاج أيضًا إلى تحديد المدة، إذا انقطع المفتاح الأول، فهل من المقبول أن تعيش مع مفتاح واحد متبقٍ فقط، لأن هناك خطرًا من أن ينكسر أيضًا.

مهم! ليس عليك أن تقرر هذه المشكلة بنفسك. يجب عليك وصف المخاطر والحلول الممكنة والتكاليف للإدارة أو إدارة الشركة. يجب عليهم اتخاذ القرارات.

لذلك ، إذا تقرر أنه ، نظرًا للاحتمال الصغير لحدوث فشل مزدوج ، فإن العمل لمدة 4 ساعات على مفتاح واحد أمر مقبول من حيث المبدأ ، فيمكنك ببساطة الحصول على الدعم المناسب (الذي سيتم بموجبه استبدال المعدات في غضون 4 ساعات) ساعات).

ولكن هناك خطر أنهم لن يحققوا ذلك. لسوء الحظ، وجدنا أنفسنا ذات مرة في مثل هذا الوضع. بدلاً من أربع ساعات سافرت المعدات لمدة أسبوع !!!

لذلك، يجب أيضًا مناقشة هذا الخطر، وربما يكون من الأصح بالنسبة لك شراء مفتاح آخر (ثالث) والاحتفاظ به في حزمة قطع الغيار (نسخة احتياطية "باردة") أو استخدامه للأغراض المختبرية.

مهم! قم بإنشاء جدول بيانات يضم كل الدعم الذي لديك مع تواريخ انتهاء الصلاحية وأضفه إلى التقويم الخاص بك حتى تتلقى رسالة بريد إلكتروني قبل شهر على الأقل تفيد بأنه يجب عليك البدء في القلق بشأن تجديد دعمك.

لن يغفر لك إذا نسيت تجديد الدعم الخاص بك وفي اليوم التالي لانتهاء تعطل أجهزتك.

عمل الطوارئ

مهما حدث على شبكتك، فمن الأفضل أن تحافظ على إمكانية الوصول إلى معدات الشبكة الخاصة بك.

مهم! يجب أن يكون لديك إمكانية الوصول إلى وحدة التحكم لجميع الأجهزة، ويجب ألا يعتمد هذا الوصول على صحة شبكة بيانات المستخدم.

يجب عليك أيضًا توقع السيناريوهات السلبية المحتملة مسبقًا وتوثيق الإجراءات اللازمة. يعد توفر هذه الوثيقة أمرًا بالغ الأهمية أيضًا، لذلك لا ينبغي نشرها على مورد مشترك للقسم فحسب، بل يجب أيضًا حفظها محليًا على أجهزة كمبيوتر المهندسين.

يجب أن يكون هناك

  • المعلومات المطلوبة لفتح تذكرة مع دعم البائع أو المتكامل
  • معلومات حول كيفية الوصول إلى أي جهاز (وحدة التحكم، الإدارة)

وبطبيعة الحال، قد يحتوي أيضًا على أي معلومات مفيدة أخرى، على سبيل المثال، وصف لإجراءات الترقية لمختلف المعدات وأوامر التشخيص المفيدة.

Партнеры

أنت الآن بحاجة إلى تقييم المخاطر المرتبطة بالشركاء. عادة هذا

  • مزودو خدمة الإنترنت ونقاط تبادل الحركة (IX)
  • مقدمي قنوات الاتصال

ما هي الأسئلة التي يجب أن تطرحها على نفسك؟ كما هو الحال مع المعدات، يجب النظر في سيناريوهات الطوارئ المختلفة. على سبيل المثال، بالنسبة لمزودي خدمة الإنترنت، يمكن أن يكون الأمر كالتالي:

  • ماذا يحدث إذا توقف مزود الإنترنت X عن تقديم الخدمة لك لسبب ما؟
  • هل سيكون لدى مقدمي الخدمة الآخرين ما يكفي من النطاق الترددي لك؟
  • ما مدى جودة الاتصال؟
  • ما مدى استقلالية موفري خدمة الإنترنت لديك وهل سيؤدي الانقطاع الخطير لأحدهم إلى مشاكل مع الآخرين؟
  • كم عدد المدخلات الضوئية في مركز البيانات الخاص بك؟
  • ماذا سيحدث إذا تم تدمير أحد المدخلات بالكامل؟

فيما يتعلق بالمدخلات، في ممارستي في شركتين مختلفتين، في مركزي بيانات مختلفين، دمرت حفارة الآبار ولم تتأثر بصرياتنا إلا بمعجزة. هذه ليست حالة نادرة.

وبطبيعة الحال، لا تحتاج فقط إلى طرح هذه الأسئلة، ولكن مرة أخرى، بدعم من الإدارة، لتوفير حل مقبول في أي موقف.

دعم

قد تكون الأولوية التالية هي النسخ الاحتياطي لتكوينات المعدات. على أية حال، هذه نقطة مهمة جداً. لن أدرج تلك الحالات التي قد تفقد فيها التكوين، فمن الأفضل عمل نسخ احتياطية منتظمة وعدم التفكير في الأمر. بالإضافة إلى ذلك، يمكن أن تكون النسخ الاحتياطية المنتظمة مفيدة جدًا في مراقبة التغييرات.

مهم! عمل نسخ احتياطية يوميا. هذه ليست كمية كبيرة من البيانات لحفظها في هذا الشأن. في الصباح، يجب أن يتلقى المهندس المناوب (أو أنت) تقريرًا من النظام، يشير بوضوح إلى ما إذا كان النسخ الاحتياطي ناجحًا أم لا، وإذا لم ينجح النسخ الاحتياطي، فيجب حل المشكلة أو إنشاء تذكرة ( راجع عمليات قسم الشبكة).

إصدارات البرامج

إن مسألة ما إذا كان الأمر يستحق ترقية برنامج الجهاز أم لا ليست واضحة تمامًا. من ناحية، فإن الإصدارات القديمة هي أخطاء ونقاط ضعف معروفة، ولكن من ناحية أخرى، فإن البرامج الجديدة، أولاً، ليست دائمًا إجراء ترقية غير مؤلم، وثانيًا، أخطاء ونقاط ضعف جديدة.

هنا تحتاج إلى العثور على الخيار الأفضل. بعض التوصيات الواضحة

  • تثبيت الإصدارات المستقرة فقط
  • ومع ذلك، لا ينبغي أن تعيش على إصدارات قديمة جدًا من البرامج
  • قم بعمل علامة تحتوي على معلومات حول مكان وجود بعض البرامج
  • قراءة التقارير بشكل دوري عن نقاط الضعف والأخطاء في إصدارات البرامج، وفي حالة وجود مشاكل حرجة، يجب عليك التفكير في الترقية

في هذه المرحلة، مع توفر وصول وحدة التحكم إلى المعدات والمعلومات حول الدعم ووصف إجراء الترقية، فأنت جاهز من حيث المبدأ لهذه الخطوة. الخيار المثالي هو عندما يكون لديك معدات مختبرية حيث يمكنك التحقق من الإجراء بأكمله، ولكن لسوء الحظ، لا يحدث هذا كثيرًا.

في حالة المعدات الهامة، يمكنك الاتصال بدعم البائع لطلب مساعدتك في الترقية.

نظام التذاكر

الآن يمكنك أن تنظر حولك. تحتاج إلى إنشاء عمليات للتفاعل مع الأقسام الأخرى وداخل القسم.

قد لا يكون هذا ضروريًا (على سبيل المثال، إذا كانت شركتك صغيرة)، لكنني أوصي بشدة بتنظيم العمل بحيث تمر جميع المهام الخارجية والداخلية عبر نظام التذاكر.

نظام التذاكر هو في الأساس الواجهة الخاصة بك للاتصالات الداخلية والخارجية، ويجب عليك وصف هذه الواجهة بتفاصيل كافية.

لنأخذ مثالاً على المهمة المهمة والشائعة المتمثلة في فتح الوصول. سأصف الخوارزمية التي عملت بشكل مثالي في إحدى الشركات.

مثال

لنبدأ بحقيقة أن عملاء الوصول غالبًا ما يصوغون رغباتهم بلغة غير مفهومة لمهندس الشبكة، أي بلغة التطبيق، على سبيل المثال، "أعطني حق الوصول إلى 1C".

ولذلك، لم نقبل أبدًا طلبات مباشرة من هؤلاء المستخدمين.
وكان هذا هو المطلب الأول

  • يجب أن تأتي طلبات الوصول من الإدارات الفنية (في حالتنا، كان هؤلاء مهندسو يونكس، ويندوز، مكتب المساعدة)

المطلب الثاني هو ذلك

  • يجب أن يتم تسجيل هذا الوصول (من قبل القسم الفني الذي تلقينا منه هذا الطلب) وكطلب نتلقى رابطًا لهذا الوصول المسجل

يجب أن يكون شكل هذا الطلب مفهوما بالنسبة لنا، أي.

  • يجب أن يحتوي الطلب على معلومات حول الشبكة الفرعية وأي شبكة فرعية يجب أن يكون الوصول إليها مفتوحًا، بالإضافة إلى البروتوكول والمنافذ (في حالة tcp/udp)

وينبغي أيضا الإشارة إليه هناك

  • وصف سبب فتح هذا الوصول
  • مؤقت أو دائم (إذا كان مؤقتًا، حتى أي تاريخ)

والنقطة المهمة جدًا هي الموافقات

  • من رئيس القسم الذي بدأ الوصول (على سبيل المثال، المحاسبة)
  • من رئيس القسم الفني ومن أين جاء هذا الطلب إلى قسم الشبكات (مثلا مكتب المساعدة)

في هذه الحالة، يعتبر "مالك" هذا الوصول هو رئيس القسم الذي بدأ الوصول (المحاسبة في مثالنا)، وهو مسؤول عن ضمان بقاء الصفحة ذات الوصول المسجل لهذا القسم محدثة .

تسجيل

هذا شيء يمكنك أن تغرق فيه. ولكن إذا كنت ترغب في تنفيذ نهج استباقي، فأنت بحاجة إلى تعلم كيفية التعامل مع هذا الطوفان من البيانات.

فيما يلي بعض التوصيات العملية:

  • تحتاج إلى مراجعة السجلات يوميا
  • في حالة المراجعة المخطط لها (وليست حالة طارئة)، يمكنك قصر نفسك على مستويات الخطورة 0، 1، 2 وإضافة أنماط محددة من المستويات الأخرى إذا رأيت ذلك ضروريًا
  • اكتب برنامجًا نصيًا يوزع السجلات ويتجاهل تلك السجلات التي أضفت أنماطها إلى قائمة التجاهل

سيسمح لك هذا الأسلوب، بمرور الوقت، بإنشاء قائمة تجاهل للسجلات التي لا تهمك وترك فقط تلك التي تعتبرها مهمة حقًا.
لقد عملت بشكل رائع بالنسبة لنا.

رصد

ليس من غير المألوف أن تفتقر الشركة إلى نظام مراقبة. يمكنك، على سبيل المثال، الاعتماد على السجلات، ولكن الجهاز قد "يموت" ببساطة دون أن يكون لديه الوقت "لقول" أي شيء، أو قد تُفقد حزمة بروتوكول udp syslog ولا تصل. بشكل عام، بالطبع، المراقبة النشطة مهمة وضرورية.

المثالان الأكثر شيوعًا في ممارستي:

  • مراقبة حمل قنوات الاتصال والروابط المهمة (على سبيل المثال، الاتصال بمقدمي الخدمة). إنها تسمح لك برؤية المشكلة المحتملة لتدهور الخدمة بشكل استباقي بسبب فقدان حركة المرور، وبالتالي تجنبها.
  • الرسوم البيانية على أساس NetFlow. إنها تجعل من السهل العثور على الحالات الشاذة في حركة المرور وهي مفيدة جدًا لاكتشاف بعض الأنواع البسيطة ولكن المهمة من هجمات القراصنة.

مهم! قم بإعداد إشعارات الرسائل القصيرة للأحداث الأكثر أهمية. وهذا ينطبق على كل من المراقبة والتسجيل. إذا لم يكن لديك وردية عمل، فيجب أن تصلك الرسائل النصية القصيرة أيضًا خارج ساعات العمل.

فكر في العملية بطريقة لا توقظ جميع المهندسين. كان لدينا مهندس في الخدمة لهذا الغرض.

تغيير التحكم

في رأيي، ليس من الضروري السيطرة على جميع التغييرات. ولكن، على أية حال، يجب أن تكون قادرًا، إذا لزم الأمر، على العثور بسهولة على من قام بإجراء تغييرات معينة على الشبكة ولماذا.

وهناك بعض النصائح:

  • استخدم نظام التذاكر لتفصيل ما تم إجراؤه على تلك التذكرة، على سبيل المثال عن طريق نسخ التكوين المطبق في التذكرة
  • استخدام إمكانات التعليق على أجهزة الشبكة (على سبيل المثال، الالتزام بالتعليق على Juniper). يمكنك كتابة رقم التذكرة
  • استخدم فرق النسخ الاحتياطية للتكوين الخاص بك

يمكنك تنفيذ ذلك كعملية، من خلال مراجعة جميع التذاكر يوميًا لإجراء التغييرات.

العمليات

يجب عليك إضفاء الطابع الرسمي ووصف العمليات في فريقك. إذا وصلت إلى هذه النقطة، فيجب أن يكون لدى فريقك العمليات التالية قيد التشغيل على الأقل:

العمليات اليومية:

  • العمل مع التذاكر
  • العمل مع السجلات
  • السيطرة على التغيير
  • ورقة الفحص اليومية

العمليات السنوية:

  • تمديد الضمانات والتراخيص

العمليات غير المتزامنة:

  • الاستجابة لحالات الطوارئ المختلفة

خاتمة الجزء الأول

هل لاحظت أن كل هذا لا يتعلق بعد بتكوين الشبكة، ولا يتعلق بالتصميم، ولا يتعلق ببروتوكولات الشبكة، ولا يتعلق بالتوجيه، ولا يتعلق بالأمان... إنه شيء موجود. لكن هذه، على الرغم من كونها مملة، إلا أنها بالطبع عناصر مهمة جدًا لعمل قسم الشبكة.

حتى الآن، كما ترون، لم تقم بتحسين أي شيء في شبكتك. إذا كانت هناك ثغرات أمنية، فستظل موجودة، وإذا كان هناك تصميم سيئ، فستظل قائمة. حتى تطبق مهاراتك ومعرفتك كمهندس شبكات، والتي على الأرجح أنفقت عليها قدرًا كبيرًا من الوقت والجهد وأحيانًا المال. ولكن عليك أولا إنشاء (أو تعزيز) الأساس، ثم البدء في البناء.

ستخبرك الأجزاء التالية بكيفية العثور على الأخطاء وإزالتها، ومن ثم تحسين البنية الأساسية لديك.

وبطبيعة الحال، ليس من الضروري أن تفعل كل شيء بالتسلسل. يمكن أن يكون الوقت حاسما. افعل ذلك بالتوازي إذا سمحت الموارد بذلك.

وإضافة مهمة. التواصل، اسأل، التشاور مع فريقك. وفي النهاية هم من يدعمون ويفعلون كل هذا.

المصدر: www.habr.com

إضافة تعليق