تصميم مركز البيانات الافتراضي

تصميم مركز البيانات الافتراضي

مقدمة

تم تعريف نظام المعلومات من وجهة نظر المستخدم بشكل جيد في GOST RV 51987 - "نظام آلي، والنتيجة هي عرض معلومات الإخراج للاستخدام اللاحق". إذا نظرنا إلى البنية الداخلية، فإن أي IS هو في الأساس نظام من الخوارزميات المترابطة التي يتم تنفيذها في التعليمات البرمجية. بالمعنى الواسع لأطروحة تورينج-تشيرتش، تقوم الخوارزمية (أو IS) بتحويل مجموعة من بيانات الإدخال إلى مجموعة من بيانات المخرجات.
بل ويمكن القول أن تحويل بيانات المدخلات هو معنى وجود نظام المعلومات. وبناء على ذلك، يتم تحديد قيمة IS ومجمع IS بأكمله من خلال قيمة بيانات المدخلات والمخرجات.
وبناءً على ذلك، يجب أن يبدأ التصميم وأن يكون قائمًا على البيانات، وأن يصمم معمارية وأساليب تتناسب مع بنية البيانات وأهميتها.

بيانات مخزنه
تتمثل إحدى المراحل الرئيسية في التحضير للتصميم في الحصول على خصائص جميع مجموعات البيانات المخططة للمعالجة والتخزين. وتشمل هذه الخصائص:
- حجم البيانات؛
— معلومات حول دورة حياة البيانات (نمو البيانات الجديدة، وعمرها، ومعالجة البيانات القديمة)؛
- تصنيف البيانات من وجهة نظر التأثير على الأعمال الأساسية للشركة (ثالوث السرية والنزاهة والتوافر) إلى جانب المؤشرات المالية (على سبيل المثال، تكلفة فقدان البيانات في الساعة الأخيرة)؛
— جغرافية معالجة البيانات (الموقع الفعلي لأنظمة المعالجة)؛
— المتطلبات التنظيمية لكل فئة بيانات (على سبيل المثال، القانون الفيدرالي 152، PCI DSS).

نظم المعلومات

لا يتم تخزين البيانات فحسب، بل تتم معالجتها (تحويلها) أيضًا بواسطة أنظمة المعلومات. الخطوة التالية بعد الحصول على خصائص البيانات هي الجرد الأكثر اكتمالا لأنظمة المعلومات وخصائصها المعمارية وترابطها ومتطلبات البنية التحتية في الوحدات التقليدية لأربعة أنواع من الموارد:
- قوة الحوسبة المعالج؛
- مقدار ذاكرة الوصول العشوائي؛
- متطلبات حجم وأداء نظام تخزين البيانات؛
- متطلبات شبكة نقل البيانات (القنوات الخارجية، القنوات بين مكونات IS).
في هذه الحالة، يجب أن تكون هناك متطلبات لكل خدمة/خدمة صغيرة كجزء من IS.
بشكل منفصل، من الضروري ملاحظة أنه من أجل التصميم الصحيح، فإن توفر البيانات حول تأثير نظم المعلومات على الأعمال الأساسية للشركة في شكل تكلفة توقف نظم المعلومات (روبل في الساعة) أمر إلزامي.

نموذج التهديد

يجب أن يكون هناك نموذج رسمي للتهديدات التي تم التخطيط لحماية البيانات/الخدمات منها. علاوة على ذلك، لا يتضمن نموذج التهديد جوانب السرية فحسب، بل يتضمن أيضًا النزاهة والتوافر. أولئك. على سبيل المثال:
— فشل الخادم الفعلي؛
— فشل المفتاح الموجود أعلى الحامل؛
- انقطاع قناة الاتصال الضوئية بين مراكز البيانات؛
- فشل نظام التخزين التشغيلي بأكمله.
في بعض الحالات، تتم كتابة نماذج التهديد ليس فقط لمكونات البنية التحتية، ولكن أيضًا لأنظمة معلومات محددة أو مكوناتها، مثل فشل نظام إدارة قواعد البيانات (DBMS) مع التدمير المنطقي لبنية البيانات.
جميع القرارات داخل المشروع للحماية من تهديد غير موصوف ليست ضرورية.

المتطلبات التنظيمية

إذا كانت البيانات التي تتم معالجتها تخضع لقواعد خاصة وضعتها الجهات التنظيمية، فستكون هناك حاجة إلى معلومات حول مجموعات البيانات وقواعد المعالجة/التخزين.

أهداف RPO/RTO

يتطلب تصميم أي نوع من الحماية وجود مؤشرات لفقدان البيانات المستهدفة ووقت استرداد الخدمة المستهدف لكل من التهديدات الموصوفة.
من الناحية المثالية، يجب أن يكون لـ RPO وRTO تكاليف مرتبطة بفقدان البيانات ووقت التوقف عن العمل لكل وحدة زمنية.

تصميم مركز البيانات الافتراضي

التقسيم إلى مجموعات الموارد

بعد جمع كافة معلومات الإدخال الأولية، تتمثل الخطوة الأولى في تجميع مجموعات البيانات والملكية الفكرية في مجموعات بناءً على نماذج التهديد والمتطلبات التنظيمية. يتم تحديد نوع تقسيم المجموعات المختلفة - برمجيًا على مستوى برنامج النظام أو فعليًا.
الأمثلة على ذلك:
— يتم فصل البيانات الشخصية التي تعالجها الدائرة فعليًا تمامًا عن الأنظمة الأخرى؛
- يتم تخزين النسخ الاحتياطية على نظام تخزين منفصل.

في هذه الحالة، يمكن أن تكون المجمعات مستقلة بشكل غير كامل، على سبيل المثال، يتم تحديد مجموعتين من موارد الحوسبة (طاقة المعالج + ذاكرة الوصول العشوائي)، والتي تستخدم تجمع تخزين بيانات واحد وتجمع موارد نقل بيانات واحد.

قوة المعالجة

تصميم مركز البيانات الافتراضي

الملخص، يتم قياس متطلبات قوة المعالجة لمركز البيانات الافتراضي من حيث عدد المعالجات الافتراضية (vCPUs) ونسبة توحيدها على المعالجات المادية (pCPU). في هذه الحالة بالذات، 1 وحدة معالجة مركزية كمبيوتر = 1 نواة معالج فعلية (باستثناء Hyper-Threading). يتم جمع عدد وحدات المعالجة المركزية الافتراضية عبر جميع مجموعات الموارد المحددة (يمكن أن يكون لكل منها عامل الدمج الخاص بها).
يتم الحصول على معامل الدمج للأنظمة المحملة تجريبيًا، استنادًا إلى البنية التحتية الحالية، أو من خلال التثبيت التجريبي واختبار الحمل. بالنسبة للأنظمة غير المحملة، يتم استخدام "أفضل الممارسات". على وجه التحديد، تشير شركة VMware إلى أن متوسط ​​النسبة هو 8:1.

الذاكرة المنطوق

يتم الحصول على إجمالي متطلبات ذاكرة الوصول العشوائي (RAM) عن طريق الجمع البسيط. لا يوصى باستخدام الاشتراك الزائد في ذاكرة الوصول العشوائي (RAM).

موارد التخزين

يتم الحصول على متطلبات التخزين ببساطة عن طريق جمع كافة المجمعات حسب السعة والأداء.
يتم التعبير عن متطلبات الأداء في IOPS مع متوسط ​​نسبة القراءة/الكتابة، وإذا لزم الأمر، الحد الأقصى لزمن الاستجابة.
يجب تحديد متطلبات جودة الخدمة (QoS) لتجمعات أو أنظمة معينة بشكل منفصل.

موارد شبكة البيانات

يتم الحصول على متطلبات شبكة البيانات ببساطة عن طريق جمع كافة مجموعات النطاق الترددي.
يجب تحديد متطلبات جودة الخدمة (QoS) وزمن الوصول (RTT) لمجموعات أو أنظمة معينة بشكل منفصل.
كجزء من متطلبات موارد شبكة البيانات، تمت الإشارة أيضًا إلى متطلبات عزل و/أو تشفير حركة مرور الشبكة والآليات المفضلة (802.1q، IPSec، وما إلى ذلك).

اختيار الهندسة المعمارية

لا يناقش هذا الدليل أي خيار آخر غير بنية x86 والمحاكاة الافتراضية للخادم بنسبة 100%. ولذلك، فإن اختيار بنية النظام الفرعي للحوسبة يعود إلى اختيار منصة المحاكاة الافتراضية للخادم، وعامل شكل الخادم، ومتطلبات تكوين الخادم العامة.

النقطة الأساسية في الاختيار هي التأكد من استخدام النهج الكلاسيكي مع فصل وظائف معالجة البيانات وتخزينها ونقلها أو تلك المتقاربة.

العمارة الكلاسيكية يتضمن استخدام أنظمة فرعية خارجية ذكية لتخزين البيانات ونقلها، بينما تساهم الخوادم فقط في قوة المعالجة وذاكرة الوصول العشوائي (RAM) في المجموعة المشتركة من الموارد المادية. في الحالات القصوى، تصبح الخوادم مجهولة تماما، ليس لديها الأقراص الخاصة بها فحسب، بل ليس لديها حتى معرف النظام. في هذه الحالة، يتم تحميل نظام التشغيل أو برنامج Hypervisor من وسائط فلاش مدمجة أو من نظام تخزين بيانات خارجي (التمهيد من SAN).
في إطار الهندسة المعمارية الكلاسيكية، يتم الاختيار بين الشفرات والرفوف بشكل أساسي على أساس المبادئ التالية:
— فعالة من حيث التكلفة (في المتوسط، الخوادم المثبتة على حامل أرخص)؛
— الكثافة الحسابية (أعلى للشفرات)؛
— استهلاك الطاقة وتبديد الحرارة (تحتوي الشفرات على وحدة محددة أعلى لكل وحدة)؛
- قابلية التوسع وإمكانية التحكم (تتطلب الشفرات عمومًا جهدًا أقل للتركيبات الكبيرة)؛
- استخدام بطاقات التوسعة (اختيار محدود جدًا للشفرات).
العمارة المتقاربة (المعروف أيضًا باسم متقارب للغاية) يتضمن الجمع بين وظائف معالجة البيانات وتخزينها، مما يؤدي إلى استخدام أقراص الخادم المحلية، ونتيجة لذلك، التخلي عن عامل الشكل النصلي الكلاسيكي. بالنسبة للأنظمة المتقاربة، يتم استخدام إما خوادم الرف أو الأنظمة العنقودية، حيث يتم الجمع بين العديد من الخوادم النصلية والأقراص المحلية في حالة واحدة.

وحدة المعالجة المركزية/الذاكرة

لحساب التكوين بشكل صحيح، تحتاج إلى فهم نوع الحمل للبيئة أو كل مجموعة من المجموعات المستقلة.
وحدة المعالجة المركزية ملزمة - بيئة محدودة الأداء من خلال قوة المعالج. لن تؤدي إضافة ذاكرة الوصول العشوائي إلى تغيير أي شيء من حيث الأداء (عدد الأجهزة الافتراضية لكل خادم).
الذاكرة ملزمة - بيئة محدودة بواسطة ذاكرة الوصول العشوائي. يتيح لك المزيد من ذاكرة الوصول العشوائي (RAM) على الخادم تشغيل المزيد من الأجهزة الافتراضية على الخادم.
GB / MHz (GB / pCPU) – متوسط ​​نسبة استهلاك ذاكرة الوصول العشوائي وطاقة المعالج بواسطة هذا الحمل المعين. يمكن استخدامه لحساب مقدار الذاكرة المطلوبة لأداء معين والعكس صحيح.

حساب تكوين الخادم

تصميم مركز البيانات الافتراضي

أولاً، تحتاج إلى تحديد كافة أنواع التحميل واتخاذ قرار بشأن دمج أو تقسيم مجموعات الحوسبة المختلفة إلى مجموعات مختلفة.
بعد ذلك، يتم تحديد نسبة GB / MHz لكل مجموعة من المجموعات المحددة عند حمل معروف مسبقًا. إذا لم يكن الحمل معروفًا مسبقًا، ولكن هناك فهم تقريبي لمستوى استخدام طاقة المعالج، فيمكنك استخدام نسب vCPU القياسية:pCPU لتحويل متطلبات المجمع إلى متطلبات فعلية.

بالنسبة لكل مجموعة، قم بتقسيم مجموع متطلبات تجمع vCPU على المعامل:
vCPUsum / vCPU:pCPU = pCPUsum – العدد المطلوب من الوحدات المادية. النوى
pCPUsum / 1.25 = pCPUht – عدد النوى المعدلة لـ Hyper-Threading
لنفترض أنه من الضروري حساب مجموعة بها 190 مركزًا / 3.5 تيرابايت من ذاكرة الوصول العشوائي. وفي الوقت نفسه، نقبل الحمل المستهدف بنسبة 50% من قوة المعالج و75% من ذاكرة الوصول العشوائي.

وحدة المعالجة المركزية للكمبيوتر
190
استخدام وحدة المعالجة المركزية
50%

م
3500
فائدة الذاكرة
75%

البريزة
جوهر
الخدمة/وحدة المعالجة المركزية
السيد ميم
الأب / مم

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

في هذه الحالة، نستخدم دائمًا التقريب إلى أقرب عدد صحيح (=ROUNDUP(A1;0)).
يتضح من الجدول أن العديد من تكوينات الخادم متوازنة مع المؤشرات المستهدفة:
— 26 خادم 2*6c / 192 جيجا بايت
— 19 خادم 2*10c / 256 جيجا بايت
— 10 خادم 2*18c / 512 جيجا بايت

يجب بعد ذلك أن يتم اختيار هذه التكوينات بناءً على عوامل إضافية، مثل الحزمة الحرارية والتبريد المتوفر، أو الخوادم المستخدمة بالفعل، أو التكلفة.

ميزات اختيار تكوين الخادم

أجهزة افتراضية واسعة. إذا كان من الضروري استضافة أجهزة افتراضية واسعة (قابلة للمقارنة بعقدة NUMA واحدة أو أكثر)، فمن المستحسن، إن أمكن، تحديد خادم بتكوين يسمح لهذه الأجهزة الافتراضية بالبقاء داخل عقدة NUMA. مع وجود عدد كبير من الأجهزة الافتراضية الواسعة، هناك خطر تجزئة موارد المجموعة، وفي هذه الحالة، يتم تحديد خوادم تسمح بوضع الأجهزة الافتراضية الواسعة بأكبر قدر ممكن من الكثافة.

حجم مجال فشل واحد.

يعتمد اختيار حجم الخادم أيضًا على مبدأ تقليل مجال الفشل الفردي. على سبيل المثال، عند الاختيار بين:
- 3x4*10c / 512 جيجا بايت
- 6x2*10c / 256 جيجا بايت
مع تساوي جميع الأمور الأخرى، يجب عليك اختيار الخيار الثاني، لأنه عندما يفشل خادم واحد (أو تتم صيانته)، لا يتم فقدان 33% من موارد المجموعة، بل 17%. وبنفس الطريقة، انخفض عدد الأجهزة الافتراضية وأنظمة المعلومات المتضررة من الحادث إلى النصف.

حساب أنظمة التخزين الكلاسيكية على أساس الأداء

تصميم مركز البيانات الافتراضي

يتم دائمًا حساب أنظمة التخزين الكلاسيكية باستخدام أسوأ السيناريوهات، باستثناء تأثير ذاكرة التخزين المؤقت التشغيلية وتحسين العمليات.
كمؤشرات أداء أساسية، نأخذ الأداء الميكانيكي من القرص (IOPSdisk):
– 7.2 كيلو – 75 IOPS
– 10 كيلو – 125 IOPS
– 15 كيلو – 175 IOPS

بعد ذلك، يتم حساب عدد الأقراص الموجودة في تجمع الأقراص باستخدام الصيغة التالية: = TotalIOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk. أين:
- إجماليIOPS – إجمالي الأداء المطلوب في IOPS من تجمع الأقراص
- RW - النسبة المئوية لعمليات القراءة
- RAIDpen – عقوبة RAID لمستوى RAID المحدد

اقرأ المزيد عن عقوبة RAID للجهاز وRAID هنا - أداء التخزين. الجزء الأول. и أداء التخزين. الجزء الثاني. и أداء التخزين. الجزء الثالث

واستنادًا إلى العدد الناتج من الأقراص، يتم حساب الخيارات الممكنة التي تلبي متطلبات سعة التخزين، بما في ذلك الخيارات ذات التخزين متعدد المستويات.
يتم النظر في حساب الأنظمة التي تستخدم SSD كطبقة تخزين بشكل منفصل.
ميزات أنظمة الحساب باستخدام Flash Cache

ذاكرة التخزين المؤقت فلاش – اسم شائع لجميع التقنيات الخاصة باستخدام ذاكرة الفلاش كذاكرة تخزين مؤقت من المستوى الثاني. عند استخدام ذاكرة تخزين مؤقت فلاشية، عادةً ما يتم حساب نظام التخزين لتوفير حمل ثابت من الأقراص المغناطيسية، بينما يتم خدمة الذروة بواسطة ذاكرة التخزين المؤقت.
في هذه الحالة، من الضروري فهم ملف تعريف التحميل ودرجة توطين الوصول إلى كتل وحدات تخزين التخزين. ذاكرة التخزين المؤقتة هي تقنية لأحمال العمل ذات الاستعلامات المحلية للغاية، ولا يمكن تطبيقها عمليًا على وحدات التخزين المحملة بشكل موحد (مثل أنظمة التحليلات).

حساب الأنظمة الهجينة المنخفضة/متوسطة المدى

تستخدم الأنظمة الهجينة للطبقات الدنيا والمتوسطة التخزين متعدد المستويات مع نقل البيانات بين المستويات وفقًا لجدول زمني. وفي الوقت نفسه، يبلغ حجم كتلة التخزين متعددة المستويات لأفضل الموديلات 256 ميجابايت. لا تسمح لنا هذه الميزات باعتبار تقنية التخزين المتدرج تقنية لزيادة الإنتاجية، كما يعتقد الكثير من الناس عن طريق الخطأ. يعد التخزين متعدد المستويات في أنظمة الطبقة المنخفضة والمتوسطة تقنية لتحسين تكاليف التخزين للأنظمة ذات التفاوت الواضح في التحميل.

بالنسبة للتخزين المتدرج، يتم حساب أداء الطبقة العليا أولاً، بينما يعتبر المستوى السفلي من التخزين يساهم فقط في سعة التخزين المفقودة. بالنسبة لنظام هجين متعدد المستويات، من الضروري استخدام تقنية ذاكرة التخزين المؤقت المؤقتة للتجميع متعدد المستويات من أجل التعويض عن انخفاض الأداء للبيانات الساخنة فجأة من المستوى الأدنى.

استخدام SSD في تجمع الأقراص المتدرج

تصميم مركز البيانات الافتراضي

هناك اختلافات في استخدام محركات أقراص SSD في تجمع أقراص متعدد المستويات، اعتمادًا على التنفيذ المحدد لخوارزميات ذاكرة التخزين المؤقت للفلاش من قبل الشركة المصنعة المحددة.
الممارسة العامة لسياسة التخزين لتجمع الأقراص بمستوى SSD هي SSD أولاً.
قراءة ذاكرة التخزين المؤقت فلاش فقط. بالنسبة لذاكرة التخزين المؤقتة للقراءة فقط، تأتي طبقة التخزين الموجودة على SSD مع توطين كبير للكتابة، بغض النظر عن ذاكرة التخزين المؤقت.
قراءة/كتابة ذاكرة التخزين المؤقت فلاش. في حالة ذاكرة التخزين المؤقت الفلاش، يتم تعيين حجم ذاكرة التخزين المؤقت للكتابة أولاً على الحد الأقصى لحجم ذاكرة التخزين المؤقت، وتظهر طبقة تخزين SSD فقط عندما يكون حجم ذاكرة التخزين المؤقت غير كافٍ لخدمة عبء العمل المترجم بالكامل.
يتم إجراء حسابات أداء SSD وذاكرة التخزين المؤقت في كل مرة بناءً على توصيات الشركة المصنعة، ولكن دائمًا في أسوأ السيناريوهات.

المصدر: www.habr.com

إضافة تعليق