نحوه انتخاب فضای ذخیره سازی بدون شلیک به پای خود

معرفی

زمان خرید فضای ذخیره سازی فرا رسیده است. کدام را بگیریم، به چه کسی گوش دهیم؟ فروشنده A در مورد فروشنده B صحبت می کند و سپس یکپارچه کننده C وجود دارد که برعکس می گوید و به فروشنده D توصیه می کند. در چنین شرایطی، حتی سر یک معمار ذخیره سازی با تجربه هم می چرخد، به خصوص با همه فروشندگان جدید و SDS و hyperconvergence که مد هستند. امروز.

بنابراین، چگونه می توانید همه چیز را بفهمید و در نهایت احمق نباشید؟ ما (آنتون مجازی آنتون ژبانکوف و بدن Evgeniy Elizarov) بیایید سعی کنیم در این مورد به زبان روسی ساده صحبت کنیم.
این مقاله شباهت های زیادی دارد و در واقع پسوندی از «طراحی مرکز داده مجازی” از نظر انتخاب سیستم های ذخیره سازی و بررسی فناوری های ذخیره سازی. به طور خلاصه به نظریه کلی نگاه می کنیم، اما توصیه می کنیم این مقاله را نیز مطالعه کنید.

برای چه؟

شما اغلب می توانید موقعیتی را مشاهده کنید که در آن یک فرد جدید به یک انجمن یا یک چت تخصصی، مانند بحث های ذخیره سازی، می آید و این سوال را می پرسد: "در اینجا آنها دو گزینه ذخیره سازی را به من ارائه می دهند - ABC SuperStorage S600 و XYZ HyperOcean 666v4، چه چیزی را توصیه می کنید. ؟"

و سردرگمی شروع می شود که چه کسی دارای چه ویژگی هایی از اجرای ویژگی های وحشتناک و غیرقابل درک است که برای یک فرد ناآماده کاملاً چینی است.

بنابراین، اولین و کلیدی ترین سوالی که باید مدت ها قبل از مقایسه مشخصات در پروپوزال های تجاری از خود بپرسید این است که چرا؟ چرا این سیستم ذخیره سازی مورد نیاز است؟

نحوه انتخاب فضای ذخیره سازی بدون شلیک به پای خود

پاسخ غیر منتظره خواهد بود، و بسیار سبک تونی رابینز - برای ذخیره داده ها. ممنون، کاپیتان! و با این حال، گاهی اوقات آنقدر در مقایسه جزئیات عمیق می شویم که فراموش می کنیم چرا در وهله اول این همه کار را انجام می دهیم.

بنابراین، وظیفه یک سیستم ذخیره سازی داده، ذخیره و دسترسی به داده ها با یک عملکرد معین است. ما با داده ها شروع می کنیم.

اطلاعات

نوع داده

ما قصد داریم چه نوع داده هایی را ذخیره کنیم؟ سوال بسیار مهمی که می‌تواند بسیاری از سیستم‌های ذخیره‌سازی را حتی در نظر نگیرد. به عنوان مثال، شما قصد دارید فیلم ها و عکس ها را ذخیره کنید. می‌توانید فوراً سیستم‌هایی را که برای دسترسی تصادفی در بلوک‌های کوچک طراحی شده‌اند، یا سیستم‌هایی با ویژگی‌های اختصاصی در فشرده‌سازی/دوپلی‌سازی، خط بزنید. اینها ممکن است به سادگی سیستم های عالی باشند، ما نمی خواهیم چیز بدی بگوییم. اما در این صورت، نقاط قوت آنها یا ضعیف می شود (فیلم و عکس فشرده نمی شود) یا به سادگی هزینه سیستم را به میزان قابل توجهی افزایش می دهد.

برعکس، اگر استفاده مورد نظر یک DBMS تراکنشی پرمشغله باشد، سیستم‌های پخش چندرسانه‌ای عالی که قادر به ارائه گیگابایت در ثانیه هستند، انتخاب ضعیفی خواهند بود.

حجم داده ها

قصد داریم چقدر داده ذخیره کنیم؟ کمیت همیشه به کیفیت تبدیل می شود؛ این را هرگز نباید فراموش کرد، به ویژه در زمان رشد تصاعدی حجم داده ها. سیستم‌های کلاس پتابایت دیگر غیر معمول نیستند، اما هرچه ظرفیت پتابایت بیشتر باشد، سیستم خاص‌تر می‌شود، عملکرد معمول سیستم‌های دسترسی تصادفی کوچک و متوسط ​​کمتر در دسترس خواهد بود. بی اهمیت است زیرا جداول آمار دسترسی بلوک به تنهایی بزرگتر از مقدار RAM موجود در کنترلرها می شود. نه به ذکر فشرده سازی / لایه بندی. فرض کنید می‌خواهیم الگوریتم فشرده‌سازی را به یک الگوریتم قدرتمندتر تغییر دهیم و 20 پتابایت داده را فشرده کنیم. چقدر طول می کشد: شش ماه، یک سال؟

از طرف دیگر، اگر نیاز به ذخیره و پردازش 500 گیگابایت داده دارید، چرا به خودتان زحمت دهید؟ فقط 500. SSD های خانگی (با DWPD کم) با این اندازه هیچ هزینه ای ندارند. چرا باید یک کارخانه Fiber Channel بسازیم و سیستم های ذخیره سازی خارجی پیشرفته ای بخریم که هزینه ای معادل یک پل چدنی دارد؟

چند درصد از کل داده های داغ است؟ بار از نظر حجم داده چقدر ناهموار است؟ اینجاست که اگر مقدار داده داغ در مقایسه با کل ناچیز باشد، فناوری ذخیره سازی لایه ای یا Flash Cache می تواند بسیار مفید باشد. یا برعکس، با یک بار یکنواخت در کل حجم، که اغلب در سیستم‌های استریم یافت می‌شود (نظارت تصویری، برخی از سیستم‌های تحلیلی)، چنین فناوری‌هایی چیزی ارائه نمی‌کنند و فقط هزینه/پیچیدگی سیستم را افزایش می‌دهند.

IP

طرف دیگر داده ها، سیستم اطلاعاتی است که از داده ها استفاده می کند. یک IS مجموعه ای از الزامات دارد که داده ها را به ارث می برند. برای اطلاعات بیشتر در مورد IS، به «طراحی مرکز داده مجازی» مراجعه کنید.

تاب آوری / الزامات در دسترس بودن

الزامات برای تحمل خطا / در دسترس بودن داده ها از IS با استفاده از آنها به ارث می رسد و در سه عدد بیان می شود - RPO, OTR, دسترس پذیری.

در دسترس بودن - سهم برای یک دوره زمانی معین که در طی آن داده ها برای کار با آنها در دسترس است. معمولاً به صورت عدد 9 بیان می شود. به عنوان مثال، دو نه در سال به این معنی است که در دسترس بودن 99٪ است یا در غیر این صورت 95 ساعت عدم دسترسی در سال مجاز است. سه نه - 9,5 ساعت در سال.

RPO / RTO شاخص کل نیستند، اما برای هر حادثه (حادثه)، بر خلاف در دسترس بودن.

RPO - مقدار داده از دست رفته در طی یک تصادف (به ساعت). به عنوان مثال، اگر پشتیبان گیری یک بار در روز انجام شود، آنگاه RPO = 24 ساعت است. آن ها در صورت بروز فاجعه و از بین رفتن کامل سیستم ذخیره سازی، داده ها تا 24 ساعت (از لحظه پشتیبان گیری) از بین می روند. بر اساس RPO مشخص شده برای IS، به عنوان مثال، مقررات پشتیبان نوشته شده است. همچنین، بر اساس RPO، می‌توانید درک کنید که چه مقدار داده‌های همزمان/ناهمزمان مورد نیاز است.

OTR - زمان بازیابی سرویس (دسترسی به داده ها) پس از یک فاجعه. بر اساس مقدار RTO داده شده، می توانیم بفهمیم که آیا یک خوشه مترو مورد نیاز است یا اینکه تکرار یک جهته کافی است. آیا به یک سیستم ذخیره سازی چند کنترلر کلاس hi-end نیاز دارید؟

نحوه انتخاب فضای ذخیره سازی بدون شلیک به پای خود

ملزومات اجرا

اگرچه این یک سوال بسیار بدیهی است، اما بیشتر مشکلات در اینجاست. بسته به اینکه قبلاً نوعی زیرساخت دارید یا خیر، راه هایی برای جمع آوری آمار لازم ساخته می شود.

شما در حال حاضر یک سیستم ذخیره سازی دارید و به دنبال جایگزینی هستید یا می خواهید سیستم دیگری را برای توسعه بخرید. اینجا همه چیز ساده است. شما متوجه می شوید که در حال حاضر چه خدماتی دارید و قصد دارید در آینده نزدیک کدام خدمات را اجرا کنید. بر اساس خدمات فعلی، شما این فرصت را دارید که آمار عملکرد را جمع آوری کنید. در مورد تعداد فعلی IOPS و تأخیر فعلی تصمیم بگیرید - این شاخص ها چه هستند و آیا برای وظایف شما کافی هستند؟ این کار هم روی خود سیستم ذخیره سازی داده و هم از طریق هاست هایی که به آن متصل هستند قابل انجام است.

علاوه بر این، شما باید نه تنها به بار فعلی، بلکه در یک دوره معین (ترجیحاً یک ماه) نگاه کنید. ببینید حداکثر پیک در طول روز چقدر است، پشتیبان‌گیری چه باری ایجاد می‌کند و غیره. اگر سیستم ذخیره سازی شما یا نرم افزار آن مجموعه کاملی از این داده ها را در اختیار شما قرار نمی دهد، می توانید از RRDtool رایگان استفاده کنید که می تواند با اکثر محبوب ترین سیستم ها و سوئیچ های ذخیره سازی کار کند و می تواند آمار دقیق عملکرد را در اختیار شما قرار دهد. همچنین ارزش بارگذاری روی هاست‌هایی که با این سیستم ذخیره‌سازی کار می‌کنند، برای ماشین‌های مجازی خاص یا اینکه دقیقاً چه چیزی روی این میزبان اجرا می‌شود را دارد.

نحوه انتخاب فضای ذخیره سازی بدون شلیک به پای خود

به طور جداگانه شایان ذکر است که اگر تاخیر در حجم و دیتا استور موجود در این حجم کاملاً متفاوت است، باید به شبکه SAN خود توجه کنید، احتمال اینکه مشکلی در آن وجود داشته باشد و قبل از خرید جدید وجود دارد. سیستم، ارزش بررسی این موضوع را دارد، زیرا احتمال بسیار بالایی برای افزایش عملکرد سیستم فعلی وجود دارد.

شما در حال ساختن یک زیرساخت از ابتدا هستید، یا سیستمی را برای خدمات جدیدی خریداری می کنید، که از بارهای آن آگاه نیستید. چندین گزینه وجود دارد: با همکاران خود در منابع تخصصی ارتباط برقرار کنید تا بار را بیابید و پیش‌بینی کنید، با یکپارچه‌ساز که تجربه اجرای خدمات مشابه را دارد و می‌تواند بار را برای شما محاسبه کند، تماس بگیرید. و گزینه سوم (معمولاً سخت ترین، به خصوص اگر مربوط به برنامه های کاربردی خانگی یا نادر باشد) این است که سعی کنید الزامات عملکرد را از توسعه دهندگان سیستم بیابید.

و لطفاً توجه داشته باشید که صحیح‌ترین گزینه از نظر کاربرد عملی، پایلوت بر روی تجهیزات فعلی یا تجهیزاتی است که برای آزمایش توسط فروشنده/ادغام‌کننده ارائه شده است.

نیازمندی های ویژه

الزامات ویژه هر چیزی است که تحت الزامات عملکرد، تحمل خطا و عملکرد برای پردازش مستقیم و ارائه داده ها قرار نمی گیرد.

یکی از ساده‌ترین الزامات ویژه برای یک سیستم ذخیره‌سازی داده را می‌توان «رسانه‌های ذخیره‌سازی بیگانه» نامید. و بلافاصله مشخص می شود که این سیستم ذخیره سازی داده باید شامل یک کتابخانه نوار یا صرفاً یک نوار درایو باشد که نسخه پشتیبان روی آن ریخته می شود. پس از آن یک فرد آموزش دیده مخصوص نوار را امضا می کند و با افتخار آن را به یک گاوصندوق مخصوص حمل می کند.
نمونه دیگری از نیازهای خاص، طراحی ضد ضربه محافظت شده است.

Где

دومین مؤلفه اصلی در انتخاب یک سیستم ذخیره سازی خاص، اطلاعات مربوط به مکان این سیستم ذخیره سازی است. از شرایط جغرافیایی یا آب و هوایی شروع می شود و به پرسنل ختم می شود.

مشتری

این سیستم ذخیره سازی برای چه کسانی برنامه ریزی شده است؟ سوال دلایل زیر دارد:

مشتری/تجاری دولتی.
مشتری تجاری هیچ محدودیتی ندارد و حتی موظف به برگزاری مناقصه نیست مگر طبق مقررات داخلی خود.

مشتری دولتی موضوع دیگری است. 44 قانون فدرال و سایر موارد با مناقصه ها و مشخصات فنی قابل اعتراض است.

مشتری تحت تحریم است
خوب، سوال در اینجا بسیار ساده است - انتخاب فقط با پیشنهادات موجود برای یک مشتری خاص محدود می شود.

مقررات داخلی / فروشندگان / مدل های مجاز برای خرید
سوال نیز بسیار ساده است، اما باید آن را به خاطر بسپارید.

کجا از نظر فیزیکی

در این قسمت تمام مسائل مربوط به جغرافیا، کانال های ارتباطی و میکرو اقلیم در محل اقامت را بررسی می کنیم.

کارکنان

چه کسی با این سیستم ذخیره سازی کار خواهد کرد؟ این مهم کمتر از آنچه خود سیستم ذخیره سازی می تواند انجام دهد نیست.
مهم نیست که سیستم ذخیره سازی از فروشنده A چقدر امیدوارکننده، جالب و فوق العاده است، نصب آن احتمالاً مفید نیست اگر کارکنان فقط نحوه کار با فروشنده B را بدانند و هیچ برنامه ای برای خریدهای بعدی و همکاری مداوم با A وجود نداشته باشد.

و البته، طرف دیگر سوال این است که چگونه پرسنل آموزش دیده در یک موقعیت جغرافیایی مشخص به طور مستقیم در شرکت و به طور بالقوه در بازار کار در دسترس هستند. برای مناطق، انتخاب سیستم‌های ذخیره‌سازی با رابط‌های ساده یا توانایی متمرکز کردن مدیریت از راه دور می‌تواند بسیار منطقی باشد. در غیر این صورت، ممکن است در برخی مواقع به شدت دردناک شود. اینترنت پر است از داستان هایی در مورد اینکه چگونه کارمند جدیدی که وارد شد، دانش آموز دیروز، چنین پیکربندی کرد که کل دفتر کشته شد.

نحوه انتخاب فضای ذخیره سازی بدون شلیک به پای خود

محیط

و البته یک سوال مهم این است که این سیستم ذخیره سازی در چه محیطی کار خواهد کرد.

  • منبع تغذیه/خنک کننده چطور؟
  • چه ارتباطی
  • کجا نصب میشه؟
  • و غیره.

اغلب این سؤالات بدیهی تلقی می شوند و به طور خاص مورد توجه قرار نمی گیرند، اما گاهی اوقات آنها هستند که می توانند همه چیز را تغییر دهند.

چه

فروشنده

از امروز (اواسط سال 2019)، بازار ذخیره سازی روسیه را می توان به 5 دسته تقسیم کرد:

  1. بالاترین بخش، شرکت های با سابقه ای با طیف گسترده ای از قفسه های دیسک از ساده ترین تا پیشرفته (HPE، DellEMC، Hitachi، NetApp، IBM / Lenovo) است.
  2. بخش دوم - شرکت هایی با خط محدود، بازیکنان خاص، فروشندگان جدی SDS یا تازه واردان در حال رشد (فوجیتسو، دیتاکور، اینفینیدات، هواوی، پیور و غیره)
  3. بخش سوم - راه حل های طاقچه در رتبه پایین، SDS ارزان، محصولات پیشرفته مبتنی بر ceph و سایر پروژه های باز (Infortrend، Starwind و غیره)
  4. بخش SOHO - سیستم های ذخیره سازی کوچک و فوق العاده کوچک در سطح خانه / دفتر کوچک (Synology، QNAP و غیره)
  5. سیستم‌های ذخیره‌سازی جایگزین وارداتی - این شامل سخت‌افزار دسته اول با برچسب‌های مجدد و نمایندگان نادر دومی است (RAIDIX، ما دومین را از قبل به آنها می‌دهیم)، اما عمدتاً این بخش سوم است (Aerodisk، باوم، دپو و غیره)

تقسیم بندی کاملاً دلخواه است و اصلاً به این معنی نیست که بخش سوم یا SOHO بد است و نمی توان از آن استفاده کرد. در پروژه‌های خاص با مجموعه داده‌ها و مشخصات بار مشخص شده، آنها می‌توانند بسیار خوب کار کنند و از نظر نسبت قیمت/کیفیت به مراتب از بخش اول پیشی بگیرند. مهم است که ابتدا در مورد اهداف، چشم انداز رشد و عملکرد مورد نیاز خود تصمیم بگیرید - و سپس Synology صادقانه به شما خدمت می کند و موهای شما نرم و ابریشمی می شوند.

یکی از عوامل مهم در انتخاب فروشنده، محیط فعلی است. چند سیستم ذخیره سازی دارید و مهندسان شما با چه سیستم های ذخیره سازی می توانند کار کنند. آیا به فروشنده دیگری، نقطه تماس دیگری نیاز دارید، آیا به تدریج کل بار را از فروشنده A به فروشنده B منتقل خواهید کرد؟

نباید موجوداتی فراتر از آنچه لازم است تولید کرد.

iSCSI/FC/File

در مورد پروتکل های دسترسی بین مهندسان اتفاق نظر وجود ندارد و این بحث بیشتر شبیه بحث های الهیاتی است تا مهندسی. اما به طور کلی می توان به نکات زیر اشاره کرد:

FCoE مرده تر از زنده

FC در مقابل iSCSI. یکی از مزایای کلیدی FC در سال 2019 نسبت به ذخیره سازی IP، یک کارخانه اختصاصی برای دسترسی به داده ها، توسط شبکه IP اختصاصی جبران می شود. FC هیچ مزیت جهانی نسبت به شبکه‌های IP ندارد و IP می‌تواند برای ساخت سیستم‌های ذخیره‌سازی با هر سطح بار، تا سیستم‌هایی برای DBMS سنگین برای سیستم بانکی مرکزی یک بانک بزرگ استفاده شود. از طرفی چند سالی است که مرگ اف سی پیشگویی می شود اما مدام چیزی مانع آن می شود. به عنوان مثال، امروزه برخی از بازیگران در بازار ذخیره سازی به طور فعال در حال توسعه استاندارد NVMEoF هستند. آیا او در سرنوشت FCoE سهیم خواهد شد یا خیر - زمان مشخص خواهد کرد.

دسترسی به فایل همچنین چیزی غیر قابل توجه نیست. NFS/CIFS در محیط های بهره وری به خوبی عمل می کند و اگر به درستی طراحی شود، شکایتی بیش از پروتکل های بلوک ندارد.

ترکیبی / تمام فلش آرایه

سیستم های ذخیره سازی کلاسیک در 2 نوع هستند:

  1. AFA (All Flash Array) - سیستم هایی که برای استفاده از SSD بهینه شده اند.
  2. Hybrid - به شما امکان می دهد از هر دو HDD و SSD یا ترکیبی از آنها استفاده کنید.

تفاوت اصلی آنها در فناوری های بازده ذخیره سازی پشتیبانی شده و حداکثر سطح عملکرد (IOPS بالا و تاخیر کم) است. هر دو سیستم (در اکثر مدل‌هایشان، بدون احتساب بخش پایین‌رده) می‌توانند هم به‌عنوان دستگاه‌های بلوک و فایل کار کنند. عملکرد پشتیبانی شده به سطح سیستم بستگی دارد و برای مدل های جوان تر اغلب به حداقل سطح کاهش می یابد. هنگامی که ویژگی های یک مدل خاص را مطالعه می کنید، و نه فقط قابلیت های کل خط را به عنوان یک کل، ارزش توجه به این نکته را دارد. همچنین البته مشخصات فنی آن مانند پردازنده، میزان حافظه، کش، تعداد و انواع پورت ها و ... نیز به سطح سیستم بستگی دارد. از نظر مدیریتی، AFA ها با سیستم های هیبریدی (دیسکی) تنها در اجرای مکانیسم های کار با درایوهای SSD متفاوت هستند و حتی اگر از SSD در یک سیستم هیبریدی استفاده کنید، این به هیچ وجه به این معنی نیست که شما قادر خواهید بود. برای دستیابی به سطح عملکرد در سطح یک سیستم AFA. همچنین، در بیشتر موارد، مکانیسم‌های ذخیره‌سازی کارآمد درون خطی در سیستم‌های هیبریدی غیرفعال می‌شوند و گنجاندن آنها منجر به از دست دادن عملکرد می‌شود.

سیستم های ذخیره سازی ویژه

علاوه بر سیستم‌های ذخیره‌سازی همه منظوره، که عمدتاً بر پردازش داده‌های عملیاتی متمرکز شده‌اند، سیستم‌های ذخیره‌سازی خاصی با اصول کلیدی وجود دارند که اساساً با موارد معمول متفاوت هستند (تأخیر کم، IOPS بالا):

رسانه ها.

این سیستم ها برای ذخیره و پردازش فایل های رسانه ای بزرگ طراحی شده اند. پاسخ تأخیر عملاً بی‌اهمیت می‌شود و توانایی ارسال و دریافت داده‌ها در یک باند گسترده در بسیاری از جریان‌های موازی به منصه ظهور می‌رسد.

کپی برداری از سیستم های ذخیره سازی برای پشتیبان گیری

از آنجایی که نسخه های پشتیبان با شباهت آنها به یکدیگر متمایز می شوند، که در شرایط عادی نادر است (متوسط ​​نسخه پشتیبان با نسخه دیروز 1-2٪ متفاوت است، این دسته از سیستم ها به طور بسیار کارآمد داده های ثبت شده روی آنها را در یک بسته بندی نسبتاً کوچک بسته بندی می کنند. تعداد رسانه های فیزیکی به عنوان مثال، در برخی موارد، نسبت فشرده سازی داده ها می تواند به 200 به 1 برسد.

سیستم های ذخیره سازی اشیاء

این سیستم‌های ذخیره‌سازی حجم‌های دسترسی بلوک و اشتراک فایل‌های معمول را ندارند و بیشتر از همه شبیه یک پایگاه داده عظیم هستند. دسترسی به یک شی ذخیره شده در چنین سیستمی توسط یک شناسه منحصر به فرد یا توسط ابرداده انجام می شود (به عنوان مثال، تمام اشیاء با فرمت JPEG با تاریخ ایجاد بین XX-XX-XXXX و YY-YY-YYYY).

سیستم انطباق.

آنها امروزه در روسیه چندان رایج نیستند، اما قابل ذکر هستند. هدف چنین سیستم های ذخیره سازی تضمین ذخیره سازی داده ها برای مطابقت با سیاست های امنیتی یا الزامات قانونی است. برخی از سیستم ها (به عنوان مثال EMC Centera) عملکردی را برای منع حذف داده ها اجرا کرده اند - به محض اینکه کلید چرخانده شود و سیستم وارد این حالت شود، نه مدیر و نه هیچ کس دیگری نمی توانند داده هایی را که قبلاً ضبط شده اند به صورت فیزیکی حذف کنند.

فناوری های اختصاصی

حافظه پنهان فلش

Flash Cache یک نام رایج برای تمام فناوری های اختصاصی برای استفاده از حافظه فلش به عنوان کش سطح دوم است. هنگام استفاده از حافظه نهان فلش، سیستم ذخیره سازی معمولاً برای ارائه بار ثابت از دیسک های مغناطیسی محاسبه می شود، در حالی که پیک توسط حافظه پنهان ارائه می شود.

در این مورد، لازم است مشخصات بار و میزان محلی سازی دسترسی به بلوک های حجم ذخیره سازی را درک کنید. حافظه پنهان فلش یک فناوری برای بارهای کاری با پرس و جوهای بسیار بومی سازی شده است و عملاً برای حجم های بارگذاری شده یکنواخت (مانند سیستم های تحلیلی) قابل استفاده نیست.

دو پیاده سازی حافظه پنهان فلش در بازار موجود است:

  • فقط خواندنی. در این حالت فقط داده های خواندنی کش ذخیره می شوند و نوشتن مستقیماً به دیسک ها می رود. برخی از سازندگان، مانند NetApp، معتقدند که نوشتن در سیستم های ذخیره سازی آنها در حال حاضر بهینه است و حافظه پنهان به هیچ وجه کمکی نخواهد کرد.
  • بخوان / بنویس. نه تنها خواندن، بلکه نوشتن نیز ذخیره می‌شود، که به شما امکان می‌دهد جریان را بافر کنید و تأثیر مجازات RAID را کاهش دهید و در نتیجه عملکرد کلی سیستم‌های ذخیره‌سازی را با مکانیزم نوشتن بهینه کمتر افزایش دهید.

طبقه بندی

ذخیره سازی چند سطحی (خست کننده) یک فناوری برای ترکیب سطوح با سطوح مختلف عملکرد مانند SSD و HDD در یک دیسک واحد است. در صورت عدم یکنواختی آشکار دسترسی به بلوک های داده، سیستم قادر خواهد بود به طور خودکار بلوک های داده را متعادل کند، بلوک های بارگذاری شده را به یک سطح با عملکرد بالا و برعکس موارد سرد را به سطح کندتر منتقل کند.

سیستم‌های ترکیبی طبقات پایین و متوسط ​​از ذخیره‌سازی چند سطحی با داده‌ها در حال حرکت بین سطوح بر اساس یک برنامه زمان‌بندی استفاده می‌کنند. در عین حال، اندازه بلوک ذخیره سازی چند سطحی برای بهترین مدل ها 256 مگابایت است. این ویژگی‌ها به ما اجازه نمی‌دهند که فناوری ذخیره‌سازی لایه‌ای را فناوری افزایش بهره‌وری بدانیم، همانطور که بسیاری از مردم به اشتباه معتقدند. ذخیره سازی چند سطحی در سیستم های طبقه پایین و متوسط، یک فناوری برای بهینه سازی هزینه های ذخیره سازی برای سیستم هایی با ناهمواری بار مشخص است.

عکس فوری

مهم نیست که چقدر در مورد قابلیت اطمینان سیستم های ذخیره سازی صحبت می کنیم، فرصت های زیادی برای از دست دادن داده ها وجود دارد که به مشکلات سخت افزاری بستگی ندارد. این می تواند ویروس ها، هکرها یا هر گونه حذف غیر عمدی/فساد داده ها باشد. به همین دلیل، پشتیبان گیری از داده های تولید، بخشی جدایی ناپذیر از کار یک مهندس است.

Snapshot یک عکس فوری از یک حجم در یک نقطه از زمان است. هنگام کار با اکثر سیستم ها، مانند مجازی سازی، پایگاه های داده و غیره. ما باید چنین عکس فوری بگیریم که از آن داده ها را در یک نسخه پشتیبان کپی کنیم، در حالی که IS ما می تواند با خیال راحت به کار با این حجم ادامه دهد. اما شایان ذکر است که همه عکس های فوری به یک اندازه مفید نیستند. فروشندگان مختلف رویکردهای متفاوتی برای ایجاد عکس های فوری مرتبط با معماری خود دارند.

CoW (کپی روی نوشتن). هنگامی که می خواهید یک بلوک داده بنویسید، محتوای اصلی آن در یک منطقه خاص کپی می شود و پس از آن نوشتن به طور معمول ادامه می یابد. این از خراب شدن داده ها در داخل عکس فوری جلوگیری می کند. به طور طبیعی، تمام این دستکاری‌های داده‌های «انگلی» باعث بار اضافی بر روی سیستم ذخیره‌سازی می‌شوند و به همین دلیل، فروشندگان با پیاده‌سازی‌های مشابه استفاده از بیش از دوجین عکس فوری را توصیه نمی‌کنند و اصلاً از آن‌ها در حجم‌های با بارگذاری بالا استفاده نمی‌کنند.

RoW (Redirect-on-Write). در این حالت، حجم اصلی به طور طبیعی منجمد می شود و هنگام تلاش برای نوشتن یک بلوک داده، سیستم ذخیره سازی داده ها را در یک منطقه خاص در فضای آزاد می نویسد و مکان این بلوک را در جدول ابرداده تغییر می دهد. این به شما امکان می دهد تعداد عملیات بازنویسی را کاهش دهید که در نهایت افت عملکرد را از بین می برد و محدودیت های مربوط به عکس های فوری و تعداد آنها را از بین می برد.

اسنپ ​​شات ها نیز در رابطه با برنامه ها دو نوع هستند:

سازگاری برنامه. در لحظه ایجاد یک عکس فوری، سیستم ذخیره سازی عاملی را در سیستم عامل مصرف کننده می کشد، که به اجبار حافظه پنهان دیسک را از حافظه به دیسک پاک می کند و برنامه را مجبور به انجام این کار می کند. در این حالت، هنگام بازیابی از یک عکس فوری، داده ها سازگار خواهند بود.

تصادف سازگار است. در این حالت هیچ اتفاقی مانند آن نمی افتد و اسنپ شات همانطور که هست ایجاد می شود. در مورد بازیابی از چنین عکس فوری، تصویر یکسان است با اتفاقی که می افتد اگر برق به طور ناگهانی خاموش شود و ممکن است مقداری داده از دست برود، در حافظه پنهان گیر کرده و هرگز به دیسک نرسد. اجرای چنین عکس های فوری آسان تر است و باعث کاهش عملکرد در برنامه ها نمی شود، اما کمتر قابل اعتماد هستند.

چرا عکس های فوری در سیستم های ذخیره سازی مورد نیاز است؟

  • پشتیبان گیری بدون عامل مستقیماً از سیستم ذخیره سازی
  • ایجاد محیط های آزمایشی بر اساس داده های واقعی
  • در مورد سیستم های ذخیره سازی فایل، می توان از آن برای ایجاد محیط های VDI از طریق استفاده از عکس های فوری سیستم ذخیره سازی به جای Hypervisor استفاده کرد.
  • با ایجاد عکس های فوری برنامه ریزی شده در فرکانس بسیار بالاتر از فرکانس پشتیبان، از RPO های کم اطمینان حاصل کنید.

کلونینگ

شبیه سازی حجم - بر اساس یک اصل مشابه به عنوان عکس های فوری کار می کند، اما نه تنها برای خواندن داده ها، بلکه برای کار کامل با آن استفاده می شود. ما می‌توانیم یک کپی دقیق از حجم خود، با تمام داده‌های روی آن، بدون کپی فیزیکی دریافت کنیم، که باعث صرفه‌جویی در فضا می‌شود. به طور معمول، شبیه سازی حجم یا در Test&Dev یا اگر می خواهید عملکرد برخی به روز رسانی ها را در IS خود بررسی کنید، استفاده می شود. شبیه سازی به شما این امکان را می دهد که از نظر منابع دیسک تا حد امکان سریع و اقتصادی این کار را انجام دهید، زیرا فقط بلوک های داده تغییر یافته نوشته می شود.

Replication / Journaling

Replication مکانیزمی برای ایجاد یک کپی از داده ها در یک سیستم ذخیره سازی فیزیکی دیگر است. به طور معمول، هر فروشنده دارای یک فناوری اختصاصی است که فقط در خط خود کار می کند. اما راه حل های شخص ثالث نیز وجود دارد، از جمله راه حل هایی که در سطح Hypervisor کار می کنند، مانند VMware vSphere Replication.

عملکرد فن آوری های اختصاصی و سهولت استفاده از آنها معمولاً بسیار برتر از فناوری های جهانی است ، اما در مواردی که به عنوان مثال ، لازم است یک نسخه از NetApp به HP MSA ساخته شود ، غیرقابل اجرا هستند.

همانند سازی به دو زیر گروه تقسیم می شود:

همزمان. در صورت تکرار همزمان، عملیات نوشتن بلافاصله به سیستم ذخیره سازی دوم ارسال می شود و تا زمانی که سیستم ذخیره سازی از راه دور تایید نشود، اجرا تایید نمی شود. به همین دلیل، تاخیر دسترسی افزایش می یابد، اما ما یک کپی آینه ای دقیق از داده ها داریم. آن ها RPO = 0 در صورت از بین رفتن سیستم ذخیره سازی اصلی.

نامتقارن. عملیات نوشتن فقط در سیستم ذخیره سازی اصلی اجرا می شود و بلافاصله تأیید می شود، در حالی که به طور همزمان در یک بافر برای انتقال دسته ای به سیستم ذخیره سازی راه دور جمع می شود. این نوع تکرار برای داده‌های کم‌ارزش یا برای کانال‌هایی با پهنای باند کم یا تأخیر زیاد (معمولی برای فواصل بیش از 100 کیلومتر) مرتبط است. بر این اساس، RPO = فرکانس ارسال بسته.

اغلب، همراه با تکثیر، مکانیسمی وجود دارد چوب بری عملیات دیسک در این حالت، یک منطقه ویژه برای ورود به سیستم اختصاص داده می شود و عملیات ضبط با عمق معین در زمان یا محدود به حجم لاگ ذخیره می شود. برای برخی از فناوری‌های اختصاصی، مانند EMC RecoverPoint، یکپارچه‌سازی با نرم‌افزار سیستم وجود دارد که به شما امکان می‌دهد بوکمارک‌های خاصی را به یک ورودی گزارش خاص پیوند دهید. به لطف این، می توان وضعیت یک حجم (یا ایجاد یک کلون) را نه فقط به 23 آوریل، 11 ساعت و 59 ثانیه و 13 میلی ثانیه، بلکه به لحظه قبل از "Drop ALL TABLES; مرتکب شدن."

خوشه مترو

خوشه مترو فناوری است که به شما امکان می دهد همانندسازی همزمان دوطرفه بین دو سیستم ذخیره سازی به گونه ای ایجاد کنید که از بیرون این جفت شبیه یک سیستم ذخیره سازی به نظر برسد. برای ایجاد خوشه هایی با بازوهای جدا شده از نظر جغرافیایی در فواصل مترو (کمتر از 100 کیلومتر) استفاده می شود.

بر اساس مثال استفاده در یک محیط مجازی سازی، متروکلاستر به شما اجازه می دهد تا یک دیتا استور با ماشین های مجازی ایجاد کنید که برای ضبط همزمان از دو مرکز داده قابل دسترسی است. در این حالت، یک خوشه در سطح هایپروایزر ایجاد می شود که متشکل از میزبان ها در مراکز داده فیزیکی مختلف، متصل به این دیتا استور است. که به شما امکان می دهد کارهای زیر را انجام دهید:

  • اتوماسیون کامل فرآیند بازیابی پس از مرگ یکی از مراکز داده. بدون هیچ وجه اضافی، تمام ماشین های مجازی که در مرکز داده متوفی کار می کنند، به طور خودکار در مرکز داده باقی مانده راه اندازی مجدد می شوند. RTO = مهلت زمانی خوشه دسترسی بالا (15 ثانیه برای VMware) + زمان بارگیری سیستم عامل و شروع خدمات.
  • اجتناب از بلایا یا به زبان روسی اجتناب از بلایا. اگر کار منبع تغذیه در مرکز داده 1 برنامه ریزی شده باشد، آنگاه این فرصت را داریم که کل بار مهم را از قبل، قبل از شروع کار، بدون توقف به مرکز داده 2 منتقل کنیم.

مجازی سازی

مجازی سازی ذخیره سازی از نظر فنی استفاده از حجم های یک سیستم ذخیره سازی دیگر به عنوان دیسک است. مجازی ساز ذخیره سازی می تواند به سادگی حجم شخص دیگری را به عنوان حجم خود به مصرف کننده منتقل کند، به طور همزمان آن را به یک سیستم ذخیره سازی دیگر منعکس کند، یا حتی یک RAID از حجم های خارجی ایجاد کند.
نمایندگان کلاسیک در کلاس مجازی سازی ذخیره سازی EMC VPLEX و IBM SVC هستند. و البته، سیستم های ذخیره سازی با قابلیت مجازی سازی - NetApp، Hitachi، IBM / Lenovo Storwize.

چرا ممکن است مورد نیاز باشد؟

  • افزونگی در سطح سیستم ذخیره سازی بین ولوم ها یک آینه ایجاد می شود و نیمی از آن می تواند در HP 3Par و دیگری در NetApp باشد. و مجازی ساز از EMC است.
  • انتقال داده ها با حداقل زمان خرابی بین سیستم های ذخیره سازی از تولید کنندگان مختلف. بیایید فرض کنیم که داده ها باید از 3Par قدیمی که حذف می شود، به Dell جدید منتقل شوند. در این حالت، مصرف کننده ها از 3Par قطع می شوند، حجم ها تحت VPLEX منتقل می شوند و دوباره به مصرف کنندگان ارائه می شوند. از آنجایی که مقدار کمی تغییر نکرده است، کار ادامه دارد. فرآیند انعکاس صدا به دل جدید در پس زمینه شروع می شود و پس از اتمام، آینه شکسته و 3Par غیرفعال می شود.
  • سازمان مترو خوشه ها.

فشرده سازی / تکراری سازی

فشرده سازی و حذف دوگانه فناوری هایی هستند که به شما امکان می دهند فضای دیسک را در سیستم ذخیره سازی خود ذخیره کنید. شایان ذکر است که همه داده ها اصولاً تحت فشرده سازی و/یا کپی برداری نیستند، در حالی که برخی از انواع داده ها بهتر فشرده و کپی می شوند و برخی برعکس.

2 نوع فشرده سازی و تکراری وجود دارد:

خطی - فشرده سازی و حذف مجدد بلوک های داده قبل از نوشتن این داده ها روی دیسک اتفاق می افتد. بنابراین، سیستم فقط هش بلوک را محاسبه می کند و آن را در جدول با موارد موجود مقایسه می کند. اولاً سریعتر از نوشتن روی دیسک است و ثانیاً فضای اضافی دیسک را هدر نمی دهیم.

پست - هنگامی که این عملیات بر روی داده های از قبل ضبط شده واقع در دیسک انجام می شود. بر این اساس، ابتدا داده ها روی دیسک نوشته می شوند و تنها پس از آن هش محاسبه می شود و بلوک های غیر ضروری حذف می شوند و منابع دیسک آزاد می شوند.

شایان ذکر است که اکثر فروشندگان از هر دو نوع استفاده می کنند که به آنها امکان می دهد این فرآیندها را بهینه کنند و در نتیجه کارایی آنها را افزایش دهند. اکثر فروشندگان ذخیره سازی ابزارهایی دارند که به شما امکان می دهد مجموعه داده های خود را تجزیه و تحلیل کنید. این ابزارها طبق منطقی که در سیستم ذخیره سازی پیاده سازی شده است کار می کنند، بنابراین سطح کارایی تخمین زده شده یکسان خواهد بود. همچنین، به خاطر داشته باشید که بسیاری از فروشندگان برنامه های ضمانت عملکرد دارند که حداقل عملکرد خوبی را برای انواع خاص (یا همه) داده ها وعده می دهند. و نباید از این برنامه غافل شوید، زیرا با محاسبه سیستم برای وظایف خود، با در نظر گرفتن ضریب کارایی یک سیستم خاص، می توانید در حجم صرفه جویی کنید. همچنین قابل توجه است که این برنامه ها برای سیستم های AFA طراحی شده اند، اما به لطف خرید حجم کمتری SSD نسبت به HDD در سیستم های کلاسیک، این امر باعث کاهش هزینه آنها می شود و اگر با هزینه یک سیستم دیسکی برابر نباشد، پس کاملا به آن نزدیک شوید

مدل

و اینجا به سوال درست میرسیم.

آنها به من دو گزینه ذخیره سازی ارائه می دهند - ABC SuperStorage S600 و XYZ HyperOcean 666v4، چه چیزی را توصیه می کنید؟

تبدیل به "در اینجا آنها به من دو گزینه ذخیره سازی ارائه می دهند - ABC SuperStorage S600 و XYZ HyperOcean 666v4، چه چیزی را توصیه می کنید؟

بار هدف ترکیبی از ماشین های مجازی VMware با حلقه های تولید/تست/توسعه است. تست = سازنده هر کدام 150 ترابایت با حداکثر عملکرد 80 IOPS 000kb بلوک 8% دسترسی تصادفی 50/80 خواندن-نوشتن. 20 ترابایت برای توسعه، 300 IOPS کافی است، 50 تصادفی، 000 نوشتن.

بهره وری احتمالاً در متروکلاستر RPO = 15 دقیقه RTO = 1 ساعت، توسعه در همانندسازی ناهمزمان RPO = 3 ساعت، آزمایش در یک سایت.

یک DBMS 50 ترابایتی وجود خواهد داشت، ورود به سیستم برای آنها خوب است.

ما سرورهای دل را در همه جا داریم، سیستم های ذخیره سازی قدیمی هیتاچی، آنها به سختی می توانند با آن کنار بیایند، ما قصد داریم تا 50٪ بار را از نظر حجم و عملکرد افزایش دهیم.

همانطور که می گویند، یک سوال درست فرموله شده شامل 80٪ از پاسخ است.

اطلاعات اضافی

آنچه باید به گفته نویسندگان اضافه شود

کتاب

  • Olifer و Olifer "شبکه های کامپیوتری". این کتاب به سیستم‌بندی و شاید درک بهتر نحوه عملکرد رسانه انتقال داده برای سیستم‌های ذخیره‌سازی IP / اترنت کمک خواهد کرد.
  • "ذخیره سازی و مدیریت اطلاعات EMC." کتابی عالی در مورد اصول اولیه سیستم های ذخیره سازی، چرایی ها، چگونه و چراها.

انجمن ها و چت ها

توصیه های عمومی

قیمت ها

در حال حاضر، در مورد قیمت ها - به طور کلی، اگر قیمت هایی برای سیستم های ذخیره سازی وجود دارد، معمولاً قیمت های فهرستی هستند که از آن هر مشتری یک تخفیف جداگانه دریافت می کند. اندازه تخفیف از تعداد زیادی پارامتر تشکیل شده است، بنابراین نمی توان پیش بینی کرد که شرکت شما چه قیمت نهایی را بدون درخواست از توزیع کننده دریافت می کند. اما در عین حال، اخیراً مدل‌های ارزان قیمت در فروشگاه‌های معمولی رایانه ظاهر می‌شوند، مانند مثلاً nix.ru یا xcom-shop.ru. در اینجا می توانید فوراً سیستم مورد نظر خود را با قیمت ثابت مانند سایر اجزای رایانه خریداری کنید.

اما می خواهم فوراً یادآوری کنم که مقایسه مستقیم با TB/$ صحیح نیست. اگر از این منظر به آن نزدیک شویم، ارزان ترین راه حل یک سرور JBOD + ساده خواهد بود که انعطاف پذیری یا قابلیت اطمینانی را که یک سیستم ذخیره سازی تمام عیار با کنترل دوگانه فراهم می کند را ارائه نمی دهد. این به هیچ وجه به این معنی نیست که JBOD منزجر کننده و یک ترفند کثیف تند و زننده است، فقط باید دوباره به وضوح درک کنید که چگونه و برای چه اهدافی از این راه حل استفاده خواهید کرد. اغلب می توانید بشنوید که در JBOD چیزی برای شکستن وجود ندارد، فقط یک هواپیمای پشتی وجود دارد. با این حال، هواپیماهای پشتی نیز گاهی اوقات از کار می افتند. همه چیز دیر یا زود خراب می شود.

در کل

مقایسه سیستم ها با یکدیگر نه تنها از نظر قیمت، یا نه تنها از نظر عملکرد، بلکه بر اساس مجموع همه شاخص ها ضروری است.

فقط در صورتی که مطمئن هستید که به HDD نیاز دارید، HDD بخرید. برای بارهای کم و انواع داده های غیرقابل تراکم، در غیر این صورت، ارزش آن را دارد که به برنامه های تضمین بهره وری ذخیره سازی SSD روی آورید، که اکنون اکثر فروشندگان دارند (و واقعاً کار می کنند، حتی در روسیه)، اما همه اینها به برنامه ها و داده هایی بستگی دارد که قرار خواهند گرفت. در این سیستم ذخیره سازی

ارزان نروید گاهی اوقات این موارد بسیاری از لحظات ناخوشایند را پنهان می کنند، که یکی از آنها Evgeniy Elizarov در مقالات خود در مورد Infortrend. و در نهایت، این ارزانی می تواند برای شما نتیجه معکوس داشته باشد. فراموش نکنید - "خسیس دو بار می پردازد."

منبع: www.habr.com

اضافه کردن نظر