يمكنك تقليل مخاطر التوقف عن العمل باستخدام بنية Shared Nothing

يعد موضوع التسامح مع الأخطاء في أنظمة تخزين البيانات ذا صلة دائمًا، لأنه في عصرنا الذي ينتشر فيه المحاكاة الافتراضية وتوحيد الموارد، تعد أنظمة التخزين هي الرابط الذي لن يؤدي فشله إلى حادث عادي فحسب، بل إلى توقف الخدمات على المدى الطويل. ولذلك، تحتوي أنظمة التخزين الحديثة على العديد من المكونات المكررة (حتى وحدات التحكم). ولكن هل هذه الحماية كافية؟

يمكنك تقليل مخاطر التوقف عن العمل باستخدام بنية Shared Nothing

بالتأكيد، يشير جميع البائعين دائمًا، عند إدراج خصائص أنظمة التخزين، إلى التسامح العالي مع الأخطاء في حلولهم، ويضيفون دائمًا المصطلح "بدون نقطة فشل واحدة". دعونا نلقي نظرة فاحصة على نظام تخزين نموذجي. لتجنب توقف الصيانة، يقوم نظام التخزين بتكرار مصادر الطاقة، ووحدات التبريد، ومنافذ الإدخال/الإخراج، ومحركات الأقراص (نعني RAID)، وبالطبع وحدات التحكم. إذا نظرت عن كثب إلى هذه البنية، ستلاحظ على الأقل نقطتين محتملتين للفشل، والتي يتم إبقاؤها صامتة بشكل متواضع:

  1. توافر لوحة الكترونية معززة واحدة
  2. وجود نسخة واحدة من البيانات

تعد اللوحة الإلكترونية المعززة جهازًا معقدًا تقنيًا ويجب أن يخضع لاختبارات جادة أثناء الإنتاج. وبالتالي، هناك حالات نادرة للغاية عندما تفشل تماما. ومع ذلك، حتى في حالة حدوث مشكلات جزئية، مثل فتحة محرك الأقراص غير العاملة، سيلزم استبدالها بإيقاف تشغيل كامل لنظام التخزين.

لا يعد إنشاء نسخ متعددة من البيانات مشكلة للوهلة الأولى. على سبيل المثال، وظيفة الاستنساخ في أنظمة التخزين، والتي تسمح لك بتحديث نسخة كاملة من البيانات على فترات زمنية معينة، منتشرة على نطاق واسع. ومع ذلك، في حالة حدوث مشكلات مع نفس التشغيل الخلفي، ستكون النسخة غير متوفرة تمامًا مثل النسخة الأصلية.

الحل الواضح تمامًا للتغلب على أوجه القصور هذه هو النسخ إلى نظام تخزين آخر. إذا أغمضنا أعيننا عن المضاعفة المتوقعة لتكلفة الأجهزة (ما زلنا نفترض أن الأشخاص الذين يختارون مثل هذا القرار يفكرون بشكل مناسب ويقبلون هذه الحقيقة مقدمًا)، فستظل هناك تكاليف محتملة لتنظيم النسخ المتماثل في شكل تراخيص، وتكاليف إضافية البرامج و الأجهزه. والأهم من ذلك، سوف تحتاج إلى ضمان اتساق البيانات المنسوخة بطريقة أو بأخرى. أولئك. إنشاء أداة تخزين افتراضية/vSAN/وما إلى ذلك، الأمر الذي يتطلب أيضًا موارد المال والوقت.

AccelStor عند إنشاء أنظمة الإتاحة العالية لدينا، وضعنا هدفًا للتخلص من أوجه القصور المذكورة أعلاه. وهكذا ظهر تفسير تقنية Shared Nothing، والتي تعني بشكل فضفاض "دون استخدام الأجهزة المشتركة".

مفهوم لا شيء مشترك تمثل الهندسة المعمارية استخدام عقدتين مستقلتين (وحدات تحكم)، لكل منهما مجموعة البيانات الخاصة بها. يحدث النسخ المتزامن بين العقد عبر واجهة InfiniBand 56G، وهي شفافة تمامًا للبرنامج الذي يعمل أعلى نظام التخزين. ونتيجة لذلك، ليس من الضروري استخدام أدوات التخزين الافتراضية ووكلاء البرامج وما إلى ذلك.

ماديًا، يمكن تنفيذ الحل ثنائي العقدة من AccelStor في نموذجين:

  • H510 - استنادًا إلى الخوادم المزدوجة في حالة مكونة من وحدتين، إذا كان هناك حاجة إلى أداء متوسط ​​وسعة تصل إلى 2 تيرابايت؛
  • H710 - استنادًا إلى خوادم فردية مكونة من وحدتين، إذا كان هناك حاجة إلى أداء عالٍ وسعة كبيرة (تصل إلى 2 تيرابايت).

يمكنك تقليل مخاطر التوقف عن العمل باستخدام بنية Shared Nothing

الموديل H510 يعتمد على الخادم المزدوج

يمكنك تقليل مخاطر التوقف عن العمل باستخدام بنية Shared Nothing

الطراز H710 يعتمد على الخوادم الفردية

يرجع استخدام عوامل الشكل المختلفة إلى الحاجة إلى أعداد مختلفة من محركات أقراص SSD لتحقيق حجم وأداء معينين. بالإضافة إلى ذلك، تعد منصة Twin أرخص وتتيح لك تقديم حلول أكثر بأسعار معقولة، وإن كان ذلك مع بعض "العيوب" المشروطة في شكل لوحة الكترونية معززة واحدة. كل شيء آخر، بما في ذلك مبادئ التشغيل، متطابق تمامًا لكلا النموذجين.

تحتوي مجموعة البيانات لكل عقدة على مجموعتين FlexiRemapبالإضافة إلى 2 قطع غيار ساخنة. كل مجموعة قادرة على تحمل فشل SSD واحد. جميع الطلبات الواردة لتسجيل العقدة تتوافق مع أيديولوجية يقوم FlexiRemap بإعادة بناء كتل بحجم 4 كيلو بايت في سلاسل متسلسلة، والتي يتم كتابتها بعد ذلك على SSD في الوضع الأكثر راحة لها (التسجيل المتسلسل). علاوة على ذلك، لا يتلقى المضيف تأكيد التسجيل إلا بعد وضع البيانات فعليًا على SSD، أي. دون التخزين المؤقت في ذاكرة الوصول العشوائي. والنتيجة هي أداء مثير للإعجاب للغاية يصل إلى 600 ألف كتابة IOPS وقراءة 1M+ IOPS (طراز H710).

كما ذكرنا سابقًا، تتم مزامنة مجموعات البيانات في الوقت الفعلي عبر واجهة InfiniBand 56G، التي تتميز بإنتاجية عالية وزمن وصول منخفض. من أجل تحقيق الاستخدام الأكثر كفاءة لقناة الاتصال عند إرسال الحزم الصغيرة. لأن توجد قناة اتصال واحدة فقط، ويتم استخدام رابط 1 جيجابت مخصص للتحقق الإضافي من معدل ضربات القلب. يتم نقل نبضات القلب فقط من خلاله، لذلك لا توجد متطلبات لخصائص السرعة.

في حالة زيادة سعة النظام (حتى 400 + تيرابايت) بسبب رفوف التوسع كما أنها متصلة أيضًا في أزواج للحفاظ على مفهوم "عدم وجود نقطة فشل واحدة".

للحصول على حماية إضافية للبيانات (بالإضافة إلى حقيقة أن لدى AccelStor نسختين بالفعل)، يتم استخدام خوارزمية سلوك خاصة في حالة فشل أي SSD. إذا فشل SSD، فستبدأ العقدة في إعادة بناء البيانات على أحد محركات الأقراص الاحتياطية الساخنة. ستتحول مجموعة FlexiRemap، الموجودة في الحالة المتدهورة، إلى وضع القراءة فقط. يتم ذلك لإزالة التداخل بين عمليات الكتابة وإعادة البناء على قرص النسخ الاحتياطي، مما يؤدي في النهاية إلى تسريع عملية الاسترداد وتقليل الوقت الذي قد يكون فيه النظام عرضة للخطر. عند الانتهاء من إعادة البناء، تعود العقدة إلى وضع القراءة والكتابة العادي.

يمكنك تقليل مخاطر التوقف عن العمل باستخدام بنية Shared Nothing

بالطبع، مثل الأنظمة الأخرى، أثناء إعادة البناء، ينخفض ​​الأداء العام (بعد كل شيء، إحدى مجموعات FlexiRemap لا تعمل للتسجيل). لكن عملية الاسترداد نفسها تتم في أسرع وقت ممكن، وهو ما يميز أنظمة AccelStor عن الحلول المقدمة من البائعين الآخرين.

خاصية أخرى مفيدة لتقنية بنية Nothing Shared هي تشغيل العقد في ما يسمى بالوضع النشط النشط الحقيقي. على عكس البنية "الكلاسيكية"، حيث تمتلك وحدة تحكم واحدة فقط وحدة تخزين/تجمع محدد، بينما تقوم الثانية ببساطة بتنفيذ عمليات الإدخال/الإخراج، في الأنظمة AccelStor تعمل كل عقدة مع مجموعة البيانات الخاصة بها ولا ترسل الطلبات إلى "جارتها". ونتيجة لذلك، تم تحسين الأداء العام للنظام بسبب المعالجة المتوازية لطلبات الإدخال/الإخراج بواسطة العقد والوصول إلى محركات الأقراص. لا يوجد أيضًا شيء مثل تجاوز الفشل، نظرًا لأنه ببساطة لا توجد حاجة لنقل التحكم في وحدات التخزين إلى عقدة أخرى في حالة حدوث فشل.

إذا قارنا تقنية بنية Nothing Shared مع ازدواجية نظام التخزين الكامل، فستكون للوهلة الأولى أدنى قليلاً من التنفيذ الكامل للتعافي من الكوارث من حيث المرونة. هذا ينطبق بشكل خاص على تنظيم خط الاتصال بين أنظمة التخزين. وبالتالي، في طراز H710، من الممكن نشر العقد على مسافة تصل إلى 100 متر من خلال استخدام كابلات InfiniBand الضوئية النشطة غير الرخيصة جدًا. ولكن حتى لو تمت مقارنتها بالتنفيذ المعتاد للنسخ المتزامن من البائعين الآخرين من خلال قناة FibreChannel المتاحة، حتى على مسافات أطول، فإن الحل المقدم من AccelStor سيكون أرخص وأسهل في التثبيت/التشغيل، لأنه ليست هناك حاجة لتثبيت أدوات ظاهرية للتخزين و/أو التكامل مع البرنامج (وهو أمر ليس ممكنًا دائمًا من حيث المبدأ). بالإضافة إلى ذلك، لا تنس أن حلول AccelStor عبارة عن جميع مصفوفات Flash ذات أداء أعلى من أداء أنظمة التخزين "الكلاسيكية" مع SSD فقط.

يمكنك تقليل مخاطر التوقف عن العمل باستخدام بنية Shared Nothing

عند استخدام بنية AccelStor's Nothing Shared، فمن الممكن تحقيق توفر نظام تخزين بنسبة 99.9999% بتكلفة معقولة جدًا. إلى جانب الموثوقية العالية للحل، بما في ذلك من خلال استخدام نسختين من البيانات، والأداء المذهل بفضل الخوارزميات الخاصة FlexiRemap، حلول من AccelStor هم مرشحون ممتازون للمناصب الرئيسية عند بناء مركز بيانات حديث.

المصدر: www.habr.com

إضافة تعليق