كيفية اختيار التخزين دون إطلاق النار على قدمك

مقدمة

حان الوقت لشراء التخزين. أي واحد يجب أن يأخذ، لمن يستمع؟ يتحدث البائع "أ" عن البائع "ب"، ثم هناك المتكامل "ج"، الذي يقول العكس وينصح البائع "د". في مثل هذه الحالة، حتى مهندس التخزين ذو الخبرة سوف يدور، خاصة مع جميع البائعين الجدد وSDS والتقارب الفائق الذي أصبح رائجًا اليوم.

إذًا، كيف يمكنك معرفة كل ذلك ولا ينتهي بك الأمر إلى أن تكون أحمقًا؟ نحن (انطونVirtual انطون زبانكوف و جسم Evgeniy Elizarov) دعونا نحاول التحدث عن هذا باللغة الروسية البسيطة.
المقال به العديد من أوجه التشابه وهو في الواقع امتداد لـ “تصميم مركز البيانات الافتراضي” من حيث اختيار أنظمة التخزين ومراجعة تقنيات التخزين. سننظر بإيجاز في النظرية العامة، لكننا ننصحك بقراءة هذه المقالة أيضًا.

لماذا

يمكنك غالبًا رؤية موقف يأتي فيه شخص جديد إلى منتدى أو دردشة متخصصة، مثل مناقشات التخزين، ويطرح السؤال: "هنا يقدمون لي خيارين للتخزين - ABC SuperStorage S600 وXYZ HyperOcean 666v4، بماذا تنصح ؟"

ويبدأ الارتباك حول من لديه ما هي ميزات تنفيذ الميزات الرهيبة وغير المفهومة، والتي تعتبر صينية تمامًا بالنسبة لشخص غير مستعد.

لذا، فإن السؤال الرئيسي والأول الذي يجب أن تطرحه على نفسك قبل فترة طويلة من مقارنة المواصفات في العروض التجارية هو لماذا؟ لماذا هناك حاجة لنظام التخزين هذا؟

كيفية اختيار التخزين دون إطلاق النار على قدمك

ستكون الإجابة غير متوقعة، وبأسلوب توني روبنز للغاية - لتخزين البيانات. شكرا لك يا كابتن! ومع ذلك، أحيانًا نتعمق كثيرًا في مقارنة التفاصيل لدرجة أننا ننسى سبب قيامنا بكل هذا في المقام الأول.

لذا، فإن مهمة نظام تخزين البيانات هي تخزين البيانات وتوفير الوصول إليها بأداء معين. سنبدأ بالبيانات.

معطيات

نوع البيانات

ما نوع البيانات التي نخطط لتخزينها؟ سؤال مهم للغاية يمكن أن يزيل العديد من أنظمة التخزين من الاعتبار. على سبيل المثال، كنت تخطط لتخزين مقاطع الفيديو والصور. يمكنك على الفور شطب الأنظمة المصممة للوصول العشوائي في كتل صغيرة، أو الأنظمة ذات الميزات الخاصة في الضغط / إلغاء البيانات المكررة. قد تكون هذه ببساطة أنظمة ممتازة، ولا نريد أن نقول أي شيء سيئ. ولكن في هذه الحالة، فإن نقاط القوة الخاصة بهم إما أن تصبح أضعف (لا يتم ضغط الفيديو والصور) أو ببساطة تزيد بشكل كبير من تكلفة النظام.

على العكس من ذلك، إذا كان الاستخدام المقصود هو نظام إدارة قواعد البيانات (DBMS) المزدحم بالمعاملات، فإن أنظمة تدفق الوسائط المتعددة الممتازة القادرة على توصيل الجيجابايت في الثانية ستكون خيارًا سيئًا.

حجم البيانات

ما مقدار البيانات التي نخطط لتخزينها؟ تتطور الكمية دائمًا إلى الجودة، ولا ينبغي أن ننسى ذلك أبدًا، خاصة في عصر النمو المتسارع في حجم البيانات. لم تعد أنظمة فئة البيتابايت غير شائعة، ولكن كلما زادت سعة البيتابايت، أصبح النظام أكثر تحديدًا، وأصبح الوصول إلى الوظائف المعتادة لأنظمة الوصول العشوائي الصغيرة والمتوسطة الحجم أقل صعوبة. إنه أمر تافه لأن جداول إحصائيات الوصول إلى الكتلة وحدها تصبح أكبر من مقدار ذاكرة الوصول العشوائي المتوفرة على وحدات التحكم. ناهيك عن الضغط/التصنيف. لنفترض أننا نريد تحويل خوارزمية الضغط إلى خوارزمية أكثر قوة وضغط 20 بيتابايت من البيانات. كم من الوقت سيستغرق: ستة أشهر، سنة؟

ومن ناحية أخرى، لماذا تهتم إذا كنت بحاجة إلى تخزين ومعالجة 500 جيجابايت من البيانات؟ 500 فقط. محركات أقراص SSD المنزلية (ذات DWPD منخفضة) بهذا الحجم لا تكلف شيئًا. لماذا نبني مصنعًا للقنوات الليفية ونشتري أنظمة تخزين خارجية متطورة بتكلفة تعادل تكلفة جسر من الحديد الزهر؟

ما هي النسبة المئوية من إجمالي البيانات الساخنة؟ ما مدى تفاوت الحمل من حيث حجم البيانات؟ هذا هو المكان الذي يمكن أن تكون فيه تقنية التخزين المتدرج أو Flash Cache مفيدة للغاية إذا كانت كمية البيانات الساخنة صغيرة مقارنة بالإجمالي. أو العكس بالعكس، مع وجود حمل موحد في جميع أنحاء الحجم بأكمله، والذي يوجد غالبًا في أنظمة البث (المراقبة بالفيديو، وبعض أنظمة التحليلات)، فإن هذه التقنيات لن تقدم أي شيء وستؤدي فقط إلى زيادة تكلفة/تعقيد النظام.

IC

الجانب الآخر من البيانات هو نظام المعلومات الذي يستخدم البيانات. لدى IS مجموعة من المتطلبات التي ترث البيانات. لمزيد من المعلومات حول نظام المعلومات، راجع "تصميم مركز البيانات الافتراضي".

متطلبات المرونة/التوفر

متطلبات التسامح مع الخطأ / توفر البيانات موروثة من IS التي تستخدمها ويتم التعبير عنها بثلاثة أرقام - RPO, RTO, توفر.

توفر - المشاركة لفترة زمنية معينة تتوفر خلالها البيانات للعمل معهم. يتم التعبير عنه عادةً بالرقم 9. على سبيل المثال، تسعتان في السنة تعني أن التوفر هو 99%، أو بخلاف ذلك يُسمح بـ 95 ساعة من عدم التوفر سنويًا. ثلاث تسعات - 9,5 ساعة في السنة.

RPO / RTO ليست مؤشرات إجمالية، ولكن لكل حادث (حادث)، على عكس التوافر.

RPO — كمية البيانات المفقودة أثناء وقوع حادث (بالساعات). على سبيل المثال، إذا تم إجراء النسخ الاحتياطية مرة واحدة يوميًا، فإن RPO = 24 ساعة. أولئك. في حالة حدوث كارثة وفقدان كامل لنظام التخزين، يمكن فقدان البيانات لمدة تصل إلى 24 ساعة (من لحظة النسخ الاحتياطي). واستنادًا إلى RPO المحدد لـ IS، على سبيل المثال، تتم كتابة لوائح النسخ الاحتياطي. أيضًا، استنادًا إلى RPO، يمكنك فهم مقدار النسخ المتماثل للبيانات المتزامنة/غير المتزامنة المطلوبة.

RTO — الوقت لاستعادة الخدمة (الوصول إلى البيانات) بعد وقوع الكارثة. استنادا إلى قيمة RTO المعطاة، يمكننا أن نفهم ما إذا كانت هناك حاجة إلى مجموعة مترو، أو ما إذا كان النسخ المتماثل أحادي الاتجاه كافيا. هل تحتاج إلى نظام تخزين متعدد وحدات التحكم متطور؟

كيفية اختيار التخزين دون إطلاق النار على قدمك

متطلبات الأداء

على الرغم من أن هذا سؤال واضح للغاية، إلا أنه حيث تنشأ معظم الصعوبات. اعتمادًا على ما إذا كان لديك بالفعل نوع ما من البنية التحتية أم لا، سيتم إنشاء طرق لجمع الإحصائيات اللازمة.

لديك بالفعل نظام تخزين وتبحث عن بديل أو ترغب في شراء نظام آخر للتوسيع. كل شيء بسيط هنا. أنت تفهم ما هي الخدمات التي لديك بالفعل والتي تخطط لتنفيذها في المستقبل القريب. استنادا إلى الخدمات الحالية، لديك الفرصة لجمع إحصاءات الأداء. حدد العدد الحالي لعمليات IOPS ووقت الاستجابة الحالي - ما هي هذه المؤشرات وهل تكفي لمهامك؟ يمكن القيام بذلك على نظام تخزين البيانات نفسه ومن المضيفين المتصلين به.

علاوة على ذلك، لا تحتاج إلى النظر فقط إلى الحمل الحالي، ولكن لفترة معينة (يفضل أن يكون ذلك شهرًا). تعرف على الحد الأقصى للذروات خلال اليوم، والحمل الذي تنشئه النسخة الاحتياطية، وما إلى ذلك. إذا كان نظام التخزين الخاص بك أو برنامجه لا يوفر لك مجموعة كاملة من هذه البيانات، فيمكنك استخدام أداة RRDtool المجانية، والتي يمكنها العمل مع معظم أنظمة التخزين والمحولات الأكثر شيوعًا ويمكنها تزويدك بإحصائيات أداء مفصلة. من المفيد أيضًا النظر إلى الحمل على الأجهزة المضيفة التي تعمل مع نظام التخزين هذا، أو لأجهزة افتراضية محددة، أو ما يعمل بالضبط على هذا المضيف.

كيفية اختيار التخزين دون إطلاق النار على قدمك

تجدر الإشارة بشكل منفصل إلى أنه إذا كانت التأخيرات في وحدة التخزين ومخزن البيانات الموجود على وحدة التخزين هذه تختلف بشكل كبير، فيجب عليك الانتباه إلى شبكة SAN الخاصة بك، فهناك احتمال كبير بوجود مشاكل بها وقبل شراء وحدة تخزين جديدة النظام، فإن الأمر يستحق النظر في هذه المشكلة، لأن هناك احتمال كبير جدًا لزيادة أداء النظام الحالي.

أنت تقوم ببناء بنية تحتية من الصفر، أو تشتري نظامًا لبعض الخدمات الجديدة، التي لا تعرف حجمها. هناك العديد من الخيارات: التواصل مع الزملاء على الموارد المتخصصة لمحاولة اكتشاف الحمل والتنبؤ به، والاتصال بمتكامل لديه خبرة في تنفيذ خدمات مماثلة ويمكنه حساب الحمل نيابةً عنك. والخيار الثالث (عادة ما يكون الأصعب، خاصة إذا كان الأمر يتعلق بالتطبيقات المكتوبة منزليًا أو النادرة) هو محاولة معرفة متطلبات الأداء من مطوري النظام.

ويرجى ملاحظة أن الخيار الأكثر صحة من وجهة نظر التطبيق العملي هو إجراء تجربة على المعدات الحالية، أو المعدات المقدمة للاختبار من قبل البائع/المتكامل.

متطلبات خاصة

المتطلبات الخاصة هي كل ما لا يندرج ضمن متطلبات الأداء والتسامح مع الأخطاء ووظيفة المعالجة المباشرة وتوفير البيانات.

أحد أبسط المتطلبات الخاصة لنظام تخزين البيانات يمكن أن يسمى "وسائط التخزين القابلة للتصرف". ويصبح من الواضح على الفور أن نظام تخزين البيانات هذا يجب أن يتضمن مكتبة أشرطة أو مجرد محرك أقراص يتم تفريغ النسخة الاحتياطية عليه. وبعد ذلك يقوم شخص مدرب خصيصًا بتوقيع الشريط ويحمله بفخر إلى خزنة خاصة.
مثال آخر على المتطلبات الخاصة هو التصميم المحمي المقاوم للصدمات.

حيث

المكون الرئيسي الثاني في اختيار نظام تخزين معين هو المعلومات حول مكان وجود نظام التخزين هذا. بدءاً من الجغرافيا أو الظروف المناخية، وانتهاءً بالأفراد.

زبون

لمن تم التخطيط لنظام التخزين هذا؟ السؤال له الأسباب التالية:

عميل حكومي/تجاري.
ليس لدى العميل التجاري أي قيود، بل إنه غير ملزم بإجراء العطاءات، إلا وفقًا للوائح الداخلية الخاصة به.

أما العميل الحكومي فهو أمر مختلف. 44 القانون الاتحادي وغيرها من المسرات مع المناقصات والمواصفات الفنية التي يمكن الطعن فيها.

العميل تحت العقوبات
حسنا، السؤال هنا بسيط للغاية - يقتصر الاختيار فقط على العروض المتاحة لعميل معين.

اللوائح الداخلية / الموردين / النماذج المسموح لها بالشراء
السؤال أيضًا بسيط للغاية، لكن عليك أن تتذكره.

حيث جسديا

في هذا الجزء، نتناول جميع المشكلات المتعلقة بالجغرافيا وقنوات الاتصال والمناخ المحلي في أماكن الإقامة.

العاملين

من سيعمل مع نظام التخزين هذا؟ وهذا لا يقل أهمية عما يمكن أن يفعله نظام التخزين نفسه.
بغض النظر عن مدى كون نظام التخزين من البائع "أ" واعدًا ورائعًا ورائعًا، فمن المحتمل ألا يكون هناك أي فائدة في تثبيته إذا كان الموظفون يعرفون فقط كيفية العمل مع البائع "ب"، ولا توجد خطط لمزيد من عمليات الشراء والتعاون المستمر مع "أ".

وبطبيعة الحال، فإن الجانب الآخر من السؤال هو مدى توفر الموظفين المدربين في موقع جغرافي معين مباشرة في الشركة وربما في سوق العمل. بالنسبة للمناطق، فإن اختيار أنظمة التخزين ذات الواجهات البسيطة أو القدرة على إدارة مركزية عن بعد يمكن أن يكون له معنى كبير. خلاف ذلك، في مرحلة ما قد تصبح مؤلمة بشكل مؤلم. الإنترنت مليء بالقصص حول كيف أن الموظف الجديد الذي وصل، طالب الأمس، قام بتكوين شيء أدى إلى مقتل المكتب بأكمله.

كيفية اختيار التخزين دون إطلاق النار على قدمك

محيط

وبالطبع السؤال المهم هو في أي بيئة سيعمل نظام التخزين هذا.

  • ماذا عن إمدادات الطاقة/التبريد؟
  • ما الاتصال
  • أين سيتم تثبيته؟
  • و هكذا.

في كثير من الأحيان يتم أخذ هذه الأسئلة كأمر مسلم به ولا يتم أخذها في الاعتبار بشكل خاص، ولكن في بعض الأحيان تكون هي التي يمكن أن تغير كل شيء.

أن

بائع

اعتبارًا من اليوم (منتصف عام 2019)، يمكن تقسيم سوق التخزين الروسي إلى 5 فئات:

  1. القسم الأعلى هو الشركات الراسخة التي لديها مجموعة واسعة من أرفف الأقراص بدءًا من الأبسط وحتى المتطورة (HPE وDellEMC وHitachi وNetApp وIBM / Lenovo)
  2. القسم الثاني - الشركات ذات الخطوط المحدودة، أو اللاعبين المتخصصين، أو بائعي SDS الجادين أو الوافدين الجدد الصاعدين (Fujitsu، Datacore، Infinidat، Huawei، Pure، إلخ.)
  3. القسم الثالث - الحلول المتخصصة من الدرجة المنخفضة، وSDS الرخيصة، والمنتجات المتقدمة القائمة على ceph وغيرها من المشاريع المفتوحة (Infortrend، Starwind، وما إلى ذلك)
  4. قطاع SOHO - أنظمة تخزين صغيرة وصغيرة جدًا على مستوى المنزل/المكاتب الصغيرة (Synology، QNAP، إلخ.)
  5. أنظمة التخزين البديلة للاستيراد - يتضمن ذلك كلاً من أجهزة القسم الأول مع ملصقات مُعاد تسميتها وممثلين نادرين للثاني (RAIDIX، سنمنحهم الثاني مقدمًا)، ولكن هذا هو القسم الثالث بشكل أساسي (Aerodisk، بوم، ديبو، الخ.)

التقسيم تعسفي تمامًا، ولا يعني على الإطلاق أن الجزء الثالث أو مقطع SOHO سيئ ولا يمكن استخدامه. في المشاريع المحددة التي تحتوي على مجموعة بيانات محددة بوضوح وملف تعريف التحميل، يمكنها العمل بشكل جيد للغاية، متجاوزة القسم الأول بكثير من حيث نسبة السعر/الجودة. من المهم أن تقرر أولاً أهدافك وآفاق النمو والوظائف المطلوبة - وبعد ذلك سوف يخدمك Synology بأمانة، وسيصبح شعرك ناعمًا وحريريًا.

أحد العوامل المهمة عند اختيار البائع هو البيئة الحالية. كم عدد أنظمة التخزين المتوفرة لديك بالفعل وما هي أنظمة التخزين التي يمكن لمهندسيك العمل معها. هل تحتاج إلى بائع آخر، أو نقطة اتصال أخرى، هل ستقوم بترحيل الحمولة بالكامل تدريجيًا من البائع أ إلى البائع ب؟

لا ينبغي للمرء أن ينتج كيانات تتجاوز ما هو ضروري.

بروتوكول iSCSI/FC/ملف

لا يوجد إجماع بين المهندسين حول مسألة بروتوكولات الوصول، والنقاش يشبه المناقشات اللاهوتية أكثر من المناقشات الهندسية. لكن بشكل عام يمكن ملاحظة النقاط التالية:

FCoE ميت أكثر من حي.

FC مقابل بروتوكول iSCSI. إحدى المزايا الرئيسية لـ FC في عام 2019 على تخزين IP، وهو مصنع مخصص للوصول إلى البيانات، يقابله شبكة IP مخصصة. ليس لدى FC أي مزايا عالمية مقارنة بشبكات IP، ويمكن استخدام IP لبناء أنظمة تخزين بأي مستوى تحميل، حتى أنظمة إدارة قواعد البيانات الثقيلة للنظام المصرفي الأساسي لبنك كبير. من ناحية أخرى، تم التنبؤ بوفاة إف سي منذ عدة سنوات، ولكن هناك شيء يمنعه باستمرار. اليوم، على سبيل المثال، يعمل بعض اللاعبين في سوق التخزين بنشاط على تطوير معيار NVMEoF. ما إذا كان سيشارك مصير FCoE - سيخبرنا الوقت.

الوصول إلى الملف كما أنه ليس شيئًا يستحق الاهتمام. يعمل NFS/CIFS بشكل جيد في بيئات الإنتاجية، وإذا تم تصميمه بشكل صحيح، فلن يكون لديه أي شكاوى أكثر من بروتوكولات الحظر.

هجين / كل مجموعة فلاش

أنظمة التخزين الكلاسيكية تأتي في نوعين:

  1. AFA (جميع مصفوفات الفلاش) - أنظمة محسنة لاستخدام SSD.
  2. هجين - يسمح لك باستخدام كل من محرك الأقراص الثابتة (HDD) ومحرك أقراص الحالة الصلبة (SSD) أو مزيج منهما.

يتمثل الاختلاف الرئيسي بينهما في تقنيات كفاءة التخزين المدعومة والحد الأقصى لمستوى الأداء (IOPS العالي وزمن الوصول المنخفض). يمكن لكلا النظامين (في معظم نماذجهما، باستثناء الجزء المنخفض) أن يعملا كأجهزة كتلة وملفات. تعتمد الوظيفة المدعومة على مستوى النظام، وبالنسبة للنماذج الأصغر سنا، غالبا ما يتم تخفيضها إلى الحد الأدنى. هذا يستحق الاهتمام عندما تدرس خصائص نموذج معين، وليس فقط إمكانيات الخط بأكمله ككل. وبطبيعة الحال، فإن خصائصه التقنية، مثل المعالج، وحجم الذاكرة، وذاكرة التخزين المؤقت، وعدد المنافذ وأنواعها، وما إلى ذلك، تعتمد أيضًا على مستوى النظام. من وجهة نظر الإدارة، تختلف AFAs عن الأنظمة الهجينة (القرص) فقط في تنفيذ آليات العمل مع محركات أقراص SSD، وحتى إذا كنت تستخدم SSD في نظام هجين، فهذا لا يعني على الإطلاق أنك ستتمكن من ذلك لتحقيق مستوى الأداء على مستوى نظام AFA . أيضًا، في معظم الحالات، يتم تعطيل آليات التخزين الفعالة المضمنة في الأنظمة المختلطة، ويؤدي تضمينها إلى فقدان الأداء.

أنظمة تخزين خاصة

بالإضافة إلى أنظمة التخزين للأغراض العامة، والتي تركز بشكل أساسي على معالجة البيانات التشغيلية، هناك أنظمة تخزين خاصة ذات مبادئ أساسية تختلف بشكل أساسي عن تلك المعتادة (زمن الوصول المنخفض، IOPS العالي):

وسائط.

تم تصميم هذه الأنظمة لتخزين ومعالجة ملفات الوسائط الكبيرة. الرد. يصبح التأخير غير مهم عمليا، وتظهر القدرة على إرسال واستقبال البيانات في نطاق واسع في العديد من التدفقات المتوازية في المقدمة.

إلغاء تكرار أنظمة التخزين للنسخ الاحتياطية.

وبما أن النسخ الاحتياطية تتميز بتشابهها مع بعضها البعض، وهو أمر نادر في الظروف العادية (يختلف متوسط ​​النسخة الاحتياطية عن نسخة الأمس بنسبة 1-2%)، فإن هذه الفئة من الأنظمة تقوم بتجميع البيانات المسجلة عليها بكفاءة عالية ضمن مساحة صغيرة إلى حد ما. عدد الوسائط المادية على سبيل المثال، في بعض الحالات، يمكن أن تصل نسب ضغط البيانات إلى 200 إلى 1.

أنظمة تخزين الكائنات.

لا تحتوي أنظمة التخزين هذه على وحدات التخزين المعتادة ومشاركة الملفات، والأهم من ذلك كله أنها تشبه قاعدة بيانات ضخمة. يتم الوصول إلى كائن مخزن في مثل هذا النظام من خلال معرف فريد أو من خلال بيانات التعريف (على سبيل المثال، جميع كائنات تنسيق JPEG التي لها تاريخ إنشاء بين XX-XX-XXXX وYY-YY-YYYY).

نظام الامتثال.

إنها ليست شائعة جدًا في روسيا اليوم، لكنها تستحق الذكر. الغرض من أنظمة التخزين هذه هو ضمان تخزين البيانات للامتثال لسياسات الأمان أو المتطلبات التنظيمية. نفذت بعض الأنظمة (على سبيل المثال EMC Centera) وظيفة لمنع حذف البيانات - بمجرد تشغيل المفتاح ودخول النظام في هذا الوضع، لا يمكن للمسؤول ولا أي شخص آخر حذف البيانات التي تم تسجيلها بالفعل.

التقنيات المسجلة الملكية

ذاكرة التخزين المؤقت فلاش

يعد Flash Cache اسمًا شائعًا لجميع التقنيات الخاصة باستخدام ذاكرة الفلاش كذاكرة تخزين مؤقت من المستوى الثاني. عند استخدام ذاكرة تخزين مؤقت فلاشية، عادةً ما يتم حساب نظام التخزين لتوفير حمل ثابت من الأقراص المغناطيسية، بينما يتم خدمة الذروة بواسطة ذاكرة التخزين المؤقت.

في هذه الحالة، من الضروري فهم ملف تعريف التحميل ودرجة توطين الوصول إلى كتل وحدات تخزين التخزين. ذاكرة التخزين المؤقتة هي تقنية لأحمال العمل ذات الاستعلامات المحلية للغاية، ولا يمكن تطبيقها عمليًا على وحدات التخزين المحملة بشكل موحد (مثل أنظمة التحليلات).

هناك نوعان من تطبيقات ذاكرة التخزين المؤقتة المتوفرة في السوق:

  • يقرأ فقط. في هذه الحالة، يتم تخزين بيانات القراءة فقط مؤقتًا، وتنتقل الكتابة مباشرةً إلى الأقراص. تعتقد بعض الشركات المصنعة، مثل NetApp، أن الكتابة إلى أنظمة التخزين الخاصة بها هي الأمثل بالفعل، ولن تساعد ذاكرة التخزين المؤقت على الإطلاق.
  • قراءة و كتابة. لا يتم تخزين القراءة مؤقتًا فحسب، بل الكتابة أيضًا، مما يسمح لك بتخزين الدفق مؤقتًا وتقليل تأثير عقوبة RAID، ونتيجة لذلك زيادة الأداء العام لأنظمة التخزين بآلية كتابة أقل مثالية.

طبقات

التخزين متعدد المستويات (المتعب) هو تقنية لدمج المستويات مع مستويات أداء مختلفة، مثل SSD وHDD، في مجموعة أقراص واحدة. في حالة التفاوت الواضح في الوصول إلى كتل البيانات، سيتمكن النظام من موازنة كتل البيانات تلقائيًا، ونقل الكتل المحملة إلى مستوى عالي الأداء، والباردة، على العكس من ذلك، إلى مستوى أبطأ.

تستخدم الأنظمة الهجينة للطبقات الدنيا والمتوسطة التخزين متعدد المستويات مع نقل البيانات بين المستويات وفقًا لجدول زمني. وفي الوقت نفسه، يبلغ حجم كتلة التخزين متعددة المستويات لأفضل الموديلات 256 ميجابايت. لا تسمح لنا هذه الميزات باعتبار تقنية التخزين المتدرج تقنية لزيادة الإنتاجية، كما يعتقد الكثير من الناس عن طريق الخطأ. يعد التخزين متعدد المستويات في أنظمة الطبقة المنخفضة والمتوسطة تقنية لتحسين تكاليف التخزين للأنظمة ذات التفاوت الواضح في التحميل.

لقطة

بغض النظر عن مدى تحدثنا عن موثوقية أنظمة التخزين، هناك العديد من الفرص لفقدان البيانات التي لا تعتمد على مشاكل في الأجهزة. قد يكون هذا فيروسات أو قراصنة أو أي حذف/إتلاف غير مقصود للبيانات. ولهذا السبب، يعد النسخ الاحتياطي لبيانات الإنتاج جزءًا لا يتجزأ من عمل المهندس.

اللقطة هي لقطة لحجم ما في وقت ما. عند العمل مع معظم الأنظمة، مثل المحاكاة الافتراضية وقواعد البيانات وما إلى ذلك. نحن بحاجة إلى التقاط مثل هذه اللقطة التي سننسخ منها البيانات إلى نسخة احتياطية، في حين أن نظام المعلومات لدينا سيكون قادرًا على مواصلة العمل بأمان مع هذا المجلد. ولكن من الجدير بالذكر أنه ليست كل اللقطات مفيدة بنفس القدر. لدى البائعين المختلفين أساليب مختلفة لإنشاء لقطات تتعلق ببنيتهم.

البقرة (نسخ عند الكتابة). عند محاولة كتابة كتلة بيانات، يتم نسخ محتوياتها الأصلية إلى منطقة خاصة، وبعد ذلك تتم عملية الكتابة بشكل طبيعي. وهذا يمنع تلف البيانات داخل اللقطة. بطبيعة الحال، كل هذه التلاعبات "الطفيلية" بالبيانات تسبب حملاً إضافيًا على نظام التخزين ولهذا السبب، لا ينصح البائعون الذين لديهم تطبيقات مماثلة باستخدام أكثر من اثنتي عشرة لقطة، وعدم استخدامها على الإطلاق في وحدات التخزين المحملة بشكل كبير.

RoW (إعادة التوجيه عند الكتابة). في هذه الحالة، يتجمد المجلد الأصلي بشكل طبيعي، وعند محاولة كتابة كتلة بيانات، يقوم نظام التخزين بكتابة البيانات إلى منطقة خاصة في المساحة الحرة، مما يغير موقع هذه الكتلة في جدول البيانات الوصفية. يتيح لك ذلك تقليل عدد عمليات إعادة الكتابة، مما يؤدي في النهاية إلى القضاء على الانخفاض في الأداء وإزالة القيود المفروضة على اللقطات وعددها.

اللقطات هي أيضًا نوعان فيما يتعلق بالتطبيقات:

اتساق التطبيق. في لحظة إنشاء لقطة، يقوم نظام التخزين بسحب وكيل في نظام التشغيل الخاص بالمستهلك، والذي يقوم بمسح ذاكرة التخزين المؤقت على القرص بالقوة من ذاكرة إلى قرص ويجبر التطبيق على القيام بذلك. في هذه الحالة، عند الاستعادة من لقطة، ستكون البيانات متسقة.

تحطم متسقة. في هذه الحالة، لا يحدث شيء من هذا القبيل ويتم إنشاء اللقطة كما هي. في حالة الاسترداد من مثل هذه اللقطة، تكون الصورة مطابقة لما يمكن أن يحدث إذا انقطعت الطاقة فجأة ومن المحتمل فقدان بعض البيانات، وعلقت في ذاكرة التخزين المؤقت ولم تصل إلى القرص أبدًا. تعتبر هذه اللقطات أسهل في التنفيذ ولا تتسبب في تدهور الأداء في التطبيقات، ولكنها أقل موثوقية.

لماذا هناك حاجة إلى لقطات على أنظمة التخزين؟

  • النسخ الاحتياطي بدون وكيل مباشرة من نظام التخزين
  • إنشاء بيئات اختبار تعتمد على بيانات حقيقية
  • في حالة أنظمة تخزين الملفات، يمكن استخدامه لإنشاء بيئات VDI من خلال استخدام لقطات نظام التخزين بدلاً من برنامج Hypervisor
  • تأكد من انخفاض عمليات RPO عن طريق إنشاء لقطات مجدولة بتردد أعلى بكثير من تردد النسخ الاحتياطي

استنساخ

استنساخ الحجم - يعمل على مبدأ مشابه للقطات، ولكنه يستخدم ليس فقط لقراءة البيانات، ولكن للعمل معها بشكل كامل. نحن قادرون على الحصول على نسخة طبق الأصل من مجلدنا، بكل البيانات الموجودة فيه، دون عمل نسخة مادية، مما سيوفر المساحة. عادةً، يتم استخدام استنساخ وحدة التخزين إما في الاختبار والتطوير أو إذا كنت تريد التحقق من وظائف بعض التحديثات على IS الخاص بك. سيسمح لك الاستنساخ بالقيام بذلك بأسرع ما يمكن وبشكل اقتصادي من حيث موارد القرص، لأنه سيتم كتابة كتل البيانات التي تم تغييرها فقط.

النسخ المتماثل / يوميات

النسخ المتماثل هو آلية لإنشاء نسخة من البيانات على نظام تخزين فعلي آخر. عادةً، يمتلك كل بائع تقنية خاصة به تعمل فقط ضمن خطه الخاص. ولكن هناك أيضًا حلول تابعة لجهات خارجية، بما في ذلك تلك التي تعمل على مستوى برنامج Hypervisor، مثل VMware vSphere Replication.

عادة ما تكون وظائف التقنيات الخاصة وسهولة استخدامها أعلى بكثير من التقنيات العالمية، ولكن يتبين أنها غير قابلة للتطبيق عندما يكون من الضروري، على سبيل المثال، إنشاء نسخة طبق الأصل من NetApp إلى HP MSA.

ينقسم النسخ إلى نوعين فرعيين:

متزامن. في حالة النسخ المتماثل المتزامن، يتم إرسال عملية الكتابة إلى نظام التخزين الثاني على الفور ولا يتم تأكيد التنفيذ حتى يؤكد نظام التخزين البعيد. ونتيجة لهذا، يزداد تأخير الوصول، ولكن لدينا نسخة طبق الأصل من البيانات. أولئك. RPO = 0 في حالة فقدان نظام التخزين الرئيسي.

غير متزامن. يتم تنفيذ عمليات الكتابة فقط على نظام التخزين الرئيسي ويتم تأكيدها على الفور، بينما يتم تجميعها في نفس الوقت في مخزن مؤقت لإرسال الدُفعات إلى نظام التخزين البعيد. هذا النوع من النسخ مناسب للبيانات الأقل قيمة، أو للقنوات ذات النطاق الترددي المنخفض أو الكمون العالي (نموذجي للمسافات التي تزيد عن 100 كيلومتر). وبناء على ذلك، RPO = تردد إرسال الحزمة.

في كثير من الأحيان، جنبا إلى جنب مع النسخ المتماثل، هناك آلية تسجيل عمليات القرص. في هذه الحالة، يتم تخصيص منطقة خاصة للتسجيل ويتم تخزين عمليات التسجيل بعمق زمني معين، أو محدودة بحجم السجل. بالنسبة لبعض التقنيات الخاصة، مثل EMC RecoverPoint، هناك تكامل مع برنامج النظام الذي يسمح لك بربط إشارات مرجعية معينة بإدخال سجل محدد. بفضل هذا، من الممكن إرجاع حالة المجلد (أو إنشاء نسخة) ليس فقط إلى 23 أبريل، 11 ساعة و59 ثانية و13 مللي ثانية، ولكن إلى اللحظة التي تسبق "إسقاط جميع الجداول؛ يقترف."

كتلة المترو

مجموعة Metro هي تقنية تسمح لك بإنشاء نسخ متزامن ثنائي الاتجاه بين نظامي تخزين بحيث يبدو هذا الزوج من الخارج وكأنه نظام تخزين واحد. يتم استخدامه لإنشاء مجموعات ذات أذرع منفصلة جغرافياً على مسافات مترو (أقل من 100 كم).

استنادا إلى مثال الاستخدام في بيئة المحاكاة الافتراضية، يتيح لك Metrocluster إنشاء مخزن بيانات مع أجهزة افتراضية، يمكن الوصول إليها للتسجيل من مركزي بيانات في وقت واحد. في هذه الحالة، يتم إنشاء مجموعة على مستوى برنامج Hypervisor، وتتكون من مضيفين في مراكز بيانات فعلية مختلفة، متصلة بمخزن البيانات هذا. والذي يسمح لك بالقيام بما يلي:

  • أتمتة كاملة لعملية الاسترداد بعد وفاة أحد مراكز البيانات. بدون أي أموال إضافية، سيتم إعادة تشغيل جميع الأجهزة الافتراضية التي تعمل في مركز البيانات المتوفى تلقائيًا في المركز المتبقي. RTO = مهلة مجموعة التوفر العالي (15 ثانية لبرنامج VMware) + الوقت لتحميل نظام التشغيل وبدء الخدمات.
  • تجنب الكوارث أو، باللغة الروسية، تجنب الكوارث. إذا تم التخطيط لأعمال إمداد الطاقة في مركز البيانات 1، فلدينا الفرصة لترحيل الحمل المهم بالكامل إلى مركز البيانات 2 بدون توقف مقدمًا، قبل بدء العمل.

الافتراضية

المحاكاة الافتراضية للتخزين هي من الناحية الفنية استخدام وحدات التخزين من نظام تخزين آخر كأقراص. يمكن لأداة التخزين الافتراضية أن تقوم ببساطة بنقل وحدة تخزين شخص آخر إلى المستهلك باعتبارها وحدة تخزين خاصة بها، أو نسخها في نفس الوقت إلى نظام تخزين آخر، أو حتى إنشاء RAID من وحدات تخزين خارجية.
الممثلون الكلاسيكيون في فئة المحاكاة الافتراضية للتخزين هم EMC VPLEX وIBM SVC. وبالطبع أنظمة التخزين ذات وظائف المحاكاة الافتراضية - NetApp و Hitachi و IBM / Lenovo Storwize.

لماذا قد تكون هناك حاجة إليها؟

  • التكرار على مستوى نظام التخزين. يتم إنشاء مرآة بين المجلدات، ويمكن أن يكون نصفها على HP 3Par، والآخر على NetApp. والمحاكاة الافتراضية من EMC.
  • انقل البيانات بأقل وقت توقف بين أنظمة التخزين من الشركات المصنعة المختلفة. لنفترض أنه يجب ترحيل البيانات من 3Par القديم، والذي سيتم شطبه، إلى Dell الجديد. في هذه الحالة، يتم قطع اتصال المستهلكين بـ 3Par، ويتم نقل وحدات التخزين ضمن VPLEX ويتم تقديمها إلى المستهلكين مرة أخرى. نظرًا لعدم حدوث تغيير يذكر في مستوى الصوت، يستمر العمل. تبدأ عملية عكس مستوى الصوت لجهاز Dell الجديد في الخلفية، وعند الانتهاء، تنكسر المرآة ويتم تعطيل 3Par.
  • تنظيم التجمعات الحضرية.

الضغط/إلغاء البيانات المكررة

يعد الضغط وإلغاء البيانات المكررة من التقنيات التي تتيح لك توفير مساحة القرص على نظام التخزين الخاص بك. تجدر الإشارة على الفور إلى أنه ليست كل البيانات تخضع للضغط و/أو إلغاء البيانات المكررة من حيث المبدأ، في حين يتم ضغط بعض أنواع البيانات وإلغاء تكرارها بشكل أفضل، والبعض الآخر - والعكس صحيح.

هناك نوعان من الضغط وإلغاء البيانات المكررة:

في النسق — يحدث ضغط كتل البيانات وإلغاء البيانات المكررة قبل كتابة هذه البيانات على القرص. وبالتالي، يقوم النظام فقط بحساب تجزئة الكتلة ومقارنتها في الجدول مع تلك الموجودة. أولا، إنه أسرع من مجرد الكتابة على القرص، وثانيا، نحن لا نضيع مساحة إضافية على القرص.

منشور - عندما يتم تنفيذ هذه العمليات على البيانات المسجلة بالفعل الموجودة على الأقراص. وفقًا لذلك، تتم كتابة البيانات أولاً على القرص، وعندها فقط يتم حساب التجزئة وحذف الكتل غير الضرورية وتحرير موارد القرص.

ومن الجدير بالذكر أن معظم البائعين يستخدمون كلا النوعين، مما يسمح لهم بتحسين هذه العمليات وبالتالي زيادة كفاءتها. يمتلك معظم موردي وحدات التخزين أدوات مساعدة تسمح لك بتحليل مجموعات البيانات الخاصة بك. تعمل هذه الأدوات المساعدة وفقًا لنفس المنطق المطبق في نظام التخزين، وبالتالي فإن مستوى الكفاءة المقدر سيكون هو نفسه. ضع في اعتبارك أيضًا أن العديد من البائعين لديهم برامج ضمان الأداء التي تعد على الأقل بأداء جيد لأنواع معينة من البيانات (أو جميعها). ويجب ألا تهمل هذا البرنامج، لأنه من خلال حساب النظام لمهامك، مع مراعاة معامل كفاءة نظام معين، يمكنك توفير الحجم. ومن الجدير بالذكر أيضًا أن هذه البرامج مصممة لأنظمة AFA، ولكن بفضل شراء حجم أصغر من محركات أقراص SSD مقارنة بمحركات الأقراص الصلبة في الأنظمة الكلاسيكية، سيؤدي ذلك إلى تقليل تكلفتها، وإذا لم تكن مساوية لتكلفة نظام القرص، إذن اقترب منه تمامًا.

نموذج

وهنا نأتي إلى السؤال الصحيح.

"إنهم يقدمون لي خيارين للتخزين - ABC SuperStorage S600 وXYZ HyperOcean 666v4، بماذا تنصحون؟"

يتحول إلى "هنا يقدمون لي خيارين للتخزين - ABC SuperStorage S600 وXYZ HyperOcean 666v4، بماذا تنصح؟"

التحميل المستهدف عبارة عن أجهزة افتراضية من برنامج VMware مختلطة مع حلقات الإنتاج/الاختبار/التطوير. اختبار = منتج. 150 تيرابايت لكل منها مع ذروة أداء تبلغ 80 IOPS، كتلة 000 كيلو بايت، وصول عشوائي بنسبة 8%، 50/80 للقراءة والكتابة. 20 تيرابايت للتطوير، 300 IOPS كافية، 50 عشوائيًا، 000 كتابة.

الإنتاجية في مجموعة Metrocluster RPO = 15 دقيقة RTO = ساعة واحدة، التطوير في النسخ المتماثل غير المتزامن RPO = 1 ساعات، اختبار في موقع واحد.

سيكون هناك نظام إدارة قواعد بيانات بسعة 50 تيرابايت، وسيكون التسجيل أمرًا رائعًا بالنسبة لهم.

لدينا خوادم Dell في كل مكان، وأنظمة التخزين القديمة من هيتاشي، بالكاد يمكنها التعامل مع الأمر، ونحن نخطط لزيادة الحمل بنسبة 50% من حيث الحجم والأداء.

كما يقولون، السؤال الذي تم صياغته بشكل صحيح يحتوي على 80٪ من الإجابة.

معلومات إضافية

ما يجب أن تقرأه بالإضافة إلى ذلك وفقًا للمؤلفين

الكتب

  • أوليفر وأوليفر "شبكات الكمبيوتر". سيساعد الكتاب على تنظيم وربما فهم أفضل لكيفية عمل وسيلة نقل البيانات لأنظمة تخزين IP / Ethernet
  • "تخزين وإدارة معلومات EMC." كتاب ممتاز عن أساسيات أنظمة التخزين، وأسباب ذلك، وكيف وأين.

المنتديات والدردشات

توصيات عامة

أسعار

الآن، بالنسبة للأسعار - بشكل عام، إذا كانت هناك أسعار لأنظمة التخزين، فهي عادة قائمة الأسعار، والتي يحصل منها كل عميل على خصم فردي. يتكون حجم الخصم من عدد كبير من المعلمات، لذلك من المستحيل التنبؤ بالسعر النهائي الذي ستحصل عليه شركتك دون سؤال الموزع. ولكن في الوقت نفسه، بدأت النماذج المنخفضة مؤخرًا في الظهور في متاجر الكمبيوتر العادية، على سبيل المثال nix.ru أو xcom-shop.ru. هنا يمكنك شراء النظام الذي تهتم به على الفور بسعر ثابت، مثل أي مكونات كمبيوتر.

ولكن أود أن أشير على الفور إلى أن المقارنة المباشرة بـ TB/$ غير صحيحة. إذا اقتربنا من وجهة النظر هذه، فسيكون الحل الأرخص هو خادم JBOD + بسيط، والذي لن يوفر المرونة أو الموثوقية التي يوفرها نظام تخزين كامل مزدوج التحكم. هذا لا يعني على الإطلاق أن JBOD مثير للاشمئزاز وخدعة قذرة سيئة، ما عليك سوى أن تفهم بوضوح شديد مرة أخرى كيف ولأي أغراض ستستخدم هذا الحل. يمكنك أن تسمع في كثير من الأحيان أنه لا يوجد شيء يمكن كسره في JBOD، فهناك لوحة الكترونية معززة واحدة فقط. ومع ذلك، تفشل اللوحات الإلكترونية المعززة أيضًا في بعض الأحيان. كل شيء ينكسر عاجلاً أم آجلاً.

في المجموع

من الضروري مقارنة الأنظمة مع بعضها البعض ليس فقط من حيث السعر، أو ليس فقط من حيث الأداء، ولكن من خلال مجمل جميع المؤشرات.

قم بشراء محرك الأقراص الصلبة فقط إذا كنت متأكدًا من أنك بحاجة إلى محرك الأقراص الثابتة. بالنسبة للأحمال المنخفضة وأنواع البيانات غير القابلة للضغط، وإلا فإن الأمر يستحق اللجوء إلى برامج ضمان كفاءة تخزين SSD، والتي يمتلكها معظم البائعين الآن (وهم يعملون بالفعل، حتى في روسيا)، ولكن كل هذا يتوقف على التطبيقات والبيانات التي سيتم تحديد موقعها على نظام التخزين هذا.

لا تذهب رخيصة. في بعض الأحيان تخفي هذه اللحظات الكثير من اللحظات غير السارة، والتي وصفها إيفجيني إليزاروف في مقالاته عنها إينفورتريند. وأنه في النهاية، هذا الرخص يمكن أن يأتي بنتائج عكسية عليك. لا تنسى - "البخيل يدفع مرتين".

المصدر: www.habr.com

إضافة تعليق