الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية

الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
كيفية تحديث معدات الشبكات في مؤسسة كبيرة دون توقف الإنتاج? يتحدث عن مشروع واسع النطاق في وضع "جراحة القلب المفتوح". مدير إدارة مشروع Linxdatacenter أوليغ فيدوروف. 

على مدى السنوات القليلة الماضية، لاحظنا زيادة طلب العملاء على الخدمات المتعلقة بمكون الشبكة في البنية التحتية لتكنولوجيا المعلومات. إن الحاجة إلى الاتصال بأنظمة تكنولوجيا المعلومات والخدمات والتطبيقات ومهام المراقبة وإدارة الأعمال التشغيلية في أي مجال تقريبًا تجبر الشركات اليوم على إيلاء اهتمام متزايد للشبكات.  

يتراوح نطاق الطلبات من ضمان التسامح مع أخطاء الشبكة إلى إنشاء وإدارة نظام مستقل للعميل من خلال شراء مجموعة من عناوين IP وإعداد بروتوكولات التوجيه وإدارة حركة المرور وفقًا للسياسات التنظيمية.

هناك أيضًا طلب متزايد على الحلول الشاملة لبناء وصيانة البنية التحتية للشبكة، وذلك بشكل أساسي من العملاء الذين يتم إنشاء البنية التحتية لشبكتهم من الصفر أو أصبحت قديمة، مما يتطلب تعديلًا جديًا. 

تزامن هذا الاتجاه مع فترة تطوير وتعقيد البنية التحتية لشبكة Linxdatacenter. لقد قمنا بتوسيع جغرافية تواجدنا في أوروبا من خلال الاتصال بالمواقع البعيدة، الأمر الذي يتطلب بدوره تحسين البنية التحتية للشبكة. 

أطلقت الشركة خدمة جديدة للعملاء، وهي Network-as-a-Service: نحن نعتني بجميع مشكلات الشبكة الخاصة بالعملاء، مما يسمح لهم بالتركيز على أعمالهم الأساسية.

وفي صيف 2020 تم الانتهاء من أول مشروع كبير في هذا الاتجاه والذي أود التحدث عنه. 

في البداية 

لجأ إلينا مجمع صناعي كبير لتحديث جزء الشبكة من البنية التحتية في إحدى مؤسساته. وكان من الضروري استبدال المعدات القديمة بمعدات جديدة، بما في ذلك قلب الشبكة.

تم آخر تحديث للمعدات في المؤسسة منذ حوالي 10 سنوات. قررت الإدارة الجديدة للمؤسسة تحسين الاتصال، بدءًا من تحديث البنية التحتية على المستوى المادي الأساسي. 

تم تقسيم المشروع إلى قسمين: ترقية مجمع الخوادم ومعدات الشبكة. كنا مسؤولين عن الجزء الثاني. 

وتضمنت المتطلبات الأساسية للعمل تقليل فترات التوقف عن العمل لخطوط إنتاج المؤسسة أثناء تنفيذ العمل (وفي بعض المناطق، القضاء على فترات التوقف تمامًا). وأي توقف يعني خسائر مالية مباشرة للعميل، وهو ما لا ينبغي أن يحدث تحت أي ظرف من الظروف. نظرًا لوضع التشغيل في المنشأة 24 × 7 × 365، بالإضافة إلى الأخذ في الاعتبار الغياب التام لفترات التوقف المخطط لها في ممارسة المؤسسة، فقد تم تكليفنا بمهمة إجراء جراحة القلب المفتوح بشكل أساسي. أصبحت هذه السمة المميزة الرئيسية للمشروع.

دعنا نذهب

تم تخطيط العمل وفق مبدأ الانتقال من عقد الشبكة البعيدة عن النواة إلى العقد الأقرب، وكذلك من تلك الأقل تأثيراً على عمل خطوط الإنتاج إلى تلك التي تؤثر بشكل مباشر على هذا العمل. 

على سبيل المثال، إذا أخذنا عقدة شبكة في قسم المبيعات، فإن انقطاع الاتصال نتيجة للعمل في هذا القسم لن يؤثر على الإنتاج بأي شكل من الأشكال. في الوقت نفسه، سيساعدنا مثل هذا الحادث، كمقاول، على التحقق من صحة النهج المختار للعمل على هذه الوحدات، وبعد تعديل الإجراءات، العمل على المراحل التالية من المشروع. 

من الضروري ليس فقط استبدال العقد والأسلاك في الشبكة، ولكن أيضًا تكوين جميع المكونات بشكل صحيح للتشغيل الصحيح للحل ككل. لقد كانت التكوينات هي التي تم اختبارها بهذه الطريقة: بدء العمل بعيدًا عن القلب، بدا أننا نمنح أنفسنا "الحق في ارتكاب الأخطاء" دون تعريض المجالات الحيوية لتشغيل المؤسسة للخطر. 

لقد حددنا المناطق التي لا تؤثر على عملية الإنتاج، وكذلك المناطق الحيوية - ورش العمل، ووحدة التحميل والتفريغ، والمستودعات، وما إلى ذلك. وفي المجالات الرئيسية، تم الاتفاق مع العميل على وقت التوقف المقبول لكل عقدة شبكة على حدة: من 1 إلى 15 XNUMX دقيقة . كان من المستحيل تجنب فصل عقد الشبكة الفردية تمامًا، حيث يجب تحويل الكبل فعليًا من المعدات القديمة إلى الجديدة، وأثناء عملية التبديل، من الضروري أيضًا فك "لحية" الأسلاك التي تشكلت خلال عدة سنوات من التشغيل دون الحاجة إلى الرعاية (أحد عواقب الاستعانة بمصادر خارجية لتركيب خطوط الكابلات).

تم تقسيم العمل إلى عدة مراحل.

المرحلة 1 - مراجعة. إعداد وتنسيق نهج تخطيط العمل وتقييم جاهزية الفرق: العميل ومقاول التركيب وفريقنا.

المرحلة 2 - تطوير شكل لتنفيذ العمل، مع التحليل والتخطيط التفصيلي العميق. لقد اخترنا تنسيق قائمة مرجعية مع إشارة دقيقة لترتيب وتسلسل الإجراءات، وصولاً إلى تسلسل تبديل أسلاك التصحيح حسب المنفذ.

المرحلة 3 – تنفيذ الأعمال في الخزانات التي لا تؤثر على الإنتاج. تقدير وتعديل وقت التوقف عن العمل لمراحل العمل اللاحقة.

المرحلة 4 – تنفيذ الأعمال في الخزانات التي تؤثر بشكل مباشر على الإنتاج. تقدير وتعديل وقت التوقف عن العمل للمرحلة النهائية من العمل.

المرحلة 5 – القيام بالعمل في غرفة الخادم لتبديل باقي المعدات . إطلاق على التوجيه على النواة الجديدة.

المرحلة 6 – التحويل المتتالي لنواة النظام من تكوينات الشبكة القديمة إلى تكوينات جديدة من أجل الانتقال السلس لمجمع النظام بأكمله (VLAN، والتوجيه، وما إلى ذلك). في هذه المرحلة، قمنا بتوصيل جميع المستخدمين ونقلنا جميع الخدمات إلى الأجهزة الجديدة، وتحققنا من صحة الاتصال، وتأكدنا من عدم توقف أي من خدمات المؤسسة، وتأكدنا من أنه في حالة حدوث أي مشاكل سيتم توصيلها مباشرة بالنواة، مما جعل من السهل استكشاف المشكلات المحتملة وإصلاحها والإعداد النهائي. 

تسريحة اللحية السلكية

تبين أن المشروع صعب أيضًا بسبب الظروف الأولية الصعبة. 

أولا، هناك عدد كبير من العقد والأقسام في الشبكة، مع طوبولوجيا معقدة وتصنيف الأسلاك وفقا للغرض منها. كان لا بد من إخراج مثل هذه "اللحى" من الخزانات و"تمشيطها" بعناية، لمعرفة السلك الذي يأتي من أين وإلى أين يقود. 

بدا الأمر كالتالي:

الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
على النحو التالي:

الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
او مثل هذا: 

الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
ثانيا، لكل مهمة من هذا القبيل، كان من الضروري إعداد ملف يصف العملية. "نأخذ السلك X من المنفذ 1 في الجهاز القديم، ونقوم بتوصيله بالمنفذ 18 في الجهاز الجديد." يبدو الأمر بسيطًا، ولكن عندما يكون لديك 48 منفذًا مسدودًا تمامًا في بياناتك المصدرية، ولا يوجد خيار التوقف (نتذكر حوالي 24 × 7 × 365)، فإن المخرج الوحيد هو العمل في كتل. كلما زاد عدد الأسلاك التي يمكنك سحبها من المعدات القديمة في وقت واحد، زادت سرعة تمشيطها وإدخالها في أجهزة الشبكة الجديدة، وتجنب الأعطال ووقت التوقف عن العمل في الشبكة. 

لذلك، في المرحلة التحضيرية، قمنا بتقسيم الشبكة إلى كتل - كل منها ينتمي إلى شبكة محلية ظاهرية محددة. كل منفذ (أو مجموعة فرعية منها) على المعدات القديمة هو أحد شبكات VLAN في هيكل الشبكة الجديد. قمنا بتجميعها على النحو التالي: المنافذ الأولى للمحول تضم شبكات المستخدمين، والشبكات المتوسطة - شبكات الإنتاج، والأخيرة - نقاط الوصول والوصلات الصاعدة. 

أتاح هذا الأسلوب سحب وتمشيط المعدات القديمة ليس فقط سلكًا واحدًا، بل 1-10 سلكًا دفعة واحدة. أدى هذا إلى تسريع عملية العمل عدة مرات.  

بالمناسبة، هذا هو شكل الأسلاك الموجودة في الخزانات بعد التمشيط: 

الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
أو على سبيل المثال مثل هذا: 

الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
بعد الانتهاء من المرحلة الثانية، أخذنا استراحة لتحليل الأخطاء وديناميكيات المشروع. على سبيل المثال، ظهرت عيوب بسيطة على الفور بسبب عدم الدقة في مخططات الشبكة المقدمة إلينا (يعني الموصل غير الصحيح في المخطط أن سلك التصحيح الذي تم شراؤه بشكل غير صحيح والحاجة إلى استبداله). 

كان الإيقاف المؤقت ضروريا، لأنه عند العمل من جانب الخادم، كان حتى خلل صغير في العملية غير مقبول. إذا كان الهدف هو ضمان وقت التوقف عن العمل في قسم الشبكة لمدة لا تزيد عن 5 دقائق، فلا يمكن تجاوزه. أي انحراف محتمل عن الجدول الزمني يجب أن يتم الاتفاق عليه مع العميل. 

ومع ذلك، فإن التخطيط المسبق وتقسيم المشروع إلى كتل جعل من الممكن تلبية فترات التوقف المخطط لها في جميع المناطق، وفي معظم الحالات، تجنبها تمامًا. 

تحدي العصر – مشروع في ظل كوفيد 

ومع ذلك، لم يكن الأمر خاليا من الصعوبات الإضافية. وبطبيعة الحال، كان فيروس كورونا أحد العوائق. 

كان العمل معقدًا بسبب بدء الوباء، وكان من المستحيل أن يكون جميع المتخصصين المشاركين في العملية حاضرين أثناء العمل في موقع العميل. تم السماح فقط لموظفي مؤسسة التثبيت بالدخول إلى الموقع، وتم التحكم من خلال غرفة Zoom - حيث كان هناك مهندس شبكة من Linxdatacenter، وأنا مدير المشروع، ومهندس شبكة من العميل المسؤول عن العمل، و فريق يقوم بأعمال التركيب.

نشأت مشاكل غير محسوبة أثناء العمل، وكان لا بد من إجراء التعديلات بسرعة. وبهذه الطريقة، كان من الممكن منع تأثير العامل البشري بسرعة (أخطاء في الدائرة، أخطاء في تحديد حالة نشاط الواجهة، وما إلى ذلك).

على الرغم من أن شكل العمل عن بعد بدا غير عادي في بداية المشروع، إلا أننا تأقلمنا بسرعة مع الظروف الجديدة ووصلنا إلى المرحلة النهائية من العمل. 

لقد أطلقنا تكوينًا مؤقتًا لإعدادات الشبكة للسماح لنواة الشبكة - القديمة والجديدة - بالعمل بالتوازي من أجل تحقيق انتقال سلس. ومع ذلك، اتضح أنه لم تتم إزالة سطر إضافي واحد من ملف التكوين الخاص بالنواة الجديدة، ولم يحدث الانتقال. هذا أجبرنا على قضاء بعض الوقت في البحث عن المشكلة. 

اتضح أن حركة المرور الرئيسية تم إرسالها بشكل صحيح، ولم تصل حركة التحكم إلى العقدة من خلال النواة الجديدة. بفضل التقسيم الواضح للمشروع إلى مراحل، كان من الممكن التعرف بسرعة على قسم الشبكة الذي نشأت فيه المشكلة، وتحديد المشكلة والقضاء عليها. 

و كنتيجة

النتائج الفنية للمشروع 

أولاً، تم إنشاء نواة جديدة لشبكة المؤسسة الجديدة، والتي قمنا ببناء حلقات مادية/منطقية لها. ويتم ذلك بطريقة تجعل لكل محول في الشبكة "ذراعًا ثانيًا". في الشبكة القديمة، تم توصيل العديد من المحولات بالقلب عبر مسار واحد وذراع واحدة (وصلة صاعدة). إذا انكسر، يصبح المفتاح غير قابل للوصول تمامًا. وإذا تم توصيل عدة محولات من خلال وصلة صاعدة واحدة، فسيؤدي الحادث إلى تعطيل قسم أو خط إنتاج كامل في المؤسسة. 

في الشبكة الجديدة، حتى حادث الشبكة الخطير إلى حد ما، لن يتمكن، تحت أي سيناريو، من إسقاط الشبكة بأكملها أو قسم كبير منها. 

تم تحديث 90% من جميع معدات الشبكة، وتم إيقاف تشغيل محولات الوسائط (محولات وسائط نشر الإشارة)، وتم التخلص من الحاجة إلى خطوط طاقة مخصصة لتشغيل المعدات عن طريق الاتصال بمفاتيح PoE، حيث يتم توفير الطاقة عبر أسلاك Ethernet. 

كما يتم وضع علامة على جميع الاتصالات البصرية في غرفة الخادم وفي الخزانات الميدانية - في جميع نقاط الاتصال الرئيسية. وهذا جعل من الممكن إعداد مخطط طوبولوجي للمعدات والاتصالات في الشبكة، مما يعكس حالتها الفعلية اليوم. 

رسم تخطيطي للشبكة
الشبكة كخدمة لمؤسسة كبيرة: حالة غير قياسية
النتيجة الأكثر أهمية من الناحية الفنية: تم تنفيذ أعمال البنية التحتية واسعة النطاق إلى حد ما بسرعة، دون خلق أي تدخل في عمل المؤسسة ودون أن يلاحظها أحد تقريبًا من قبل موظفيها. 

نتائج أعمال المشروع

في رأيي، هذا المشروع مثير للاهتمام في المقام الأول ليس من الجانب الفني، ولكن من الجانب التنظيمي. تكمن الصعوبة في المقام الأول في التخطيط والتفكير من خلال خطوات تنفيذ مهام المشروع. 

يتيح لنا نجاح المشروع أن نقول إن مبادرتنا لتطوير منطقة الشبكات ضمن مجموعة خدمات Linxdatacenter هي الاختيار الصحيح لمتجه التطوير الخاص بالشركة. إن النهج المسؤول لإدارة المشروع والاستراتيجية المختصة والتخطيط الواضح سمح لنا بإكمال العمل على المستوى المناسب. 

تأكيد جودة العمل هو طلب من العميل لمواصلة تقديم خدمات تحديث الشبكة في مواقعه المتبقية في روسيا.

المصدر: www.habr.com

إضافة تعليق