[ابر محاسبات 2019]. ذخیره سازی چند ابری به عنوان یک منطقه کاربردی برای درایوهای جدید Kingston DC1000M

تصور کنید که یک تجارت پزشکی نوآورانه راه اندازی می کنید - انتخاب فردی از داروها بر اساس تجزیه و تحلیل ژنوم انسان. هر بیمار 3 میلیارد جفت ژن دارد و یک سرور معمولی روی پردازنده های x86 چندین روز طول می کشد تا محاسبه شود. می‌دانید که می‌توانید با یک پردازنده FPGA که محاسبات را در هزاران رشته موازی می‌کند، فرآیند را در سرور افزایش دهید. این محاسبه ژنوم را در حدود یک ساعت کامل می کند. چنین سرورهایی را می توان از خدمات وب آمازون (AWS) اجاره کرد. اما نکته اینجاست: مشتری، بیمارستان، قاطعانه مخالف قرار دادن داده های ژنتیکی در ابر ارائه دهنده است. باید چکار کنم؟ کینگستون و استارتاپ ابری معماری را در نمایشگاه Supercomputing-2019 به نمایش گذاشتند فضای ذخیره سازی چند ابری خصوصی (PMCS)، که این مشکل را حل می کند.

[ابر محاسبات 2019]. ذخیره سازی چند ابری به عنوان یک منطقه کاربردی برای درایوهای جدید Kingston DC1000M

سه شرط برای محاسبات با کارایی بالا

محاسبه ژنوم انسان تنها وظیفه در زمینه محاسبات با عملکرد بالا (HPC، High Performance Computing) نیست. دانشمندان میدان های فیزیکی را محاسبه می کنند، مهندسان قطعات هواپیما را محاسبه می کنند، سرمایه داران مدل های اقتصادی را محاسبه می کنند، و با هم داده های بزرگ را تجزیه و تحلیل می کنند، شبکه های عصبی می سازند، و بسیاری از محاسبات پیچیده دیگر را انجام می دهند.

سه شرط HPC عبارتند از قدرت محاسباتی بسیار زیاد، ذخیره سازی بسیار بزرگ و سریع و توان عملیاتی بالای شبکه. بنابراین، روش استاندارد برای انجام محاسبات LPC در مرکز داده خود شرکت (در محل) یا در یک ارائه دهنده در فضای ابری است.

اما همه شرکت‌ها مراکز داده مخصوص به خود را ندارند و آن‌هایی که اغلب این کار را انجام می‌دهند از نظر کارایی منابع در مقایسه با مراکز داده تجاری پایین‌تر هستند (هزینه‌های سرمایه برای خرید و به‌روزرسانی سخت‌افزار و نرم‌افزار، پرداخت برای پرسنل با مهارت بالا و غیره مورد نیاز است). برعکس، ارائه دهندگان ابری، منابع فناوری اطلاعات را بر اساس مدل هزینه عملیاتی «پرداخت در زمان خرید» ارائه می کنند، یعنی. اجاره فقط برای مدت استفاده شارژ می شود. پس از تکمیل محاسبات، سرورها را می توان از حساب حذف کرد و بدین ترتیب در بودجه IT صرفه جویی کرد. اما اگر ممنوعیت قانونی یا شرکتی برای انتقال داده به ارائه دهنده وجود داشته باشد، محاسبات HPC در فضای ابری در دسترس نیست.

فضای ذخیره سازی چند ابری خصوصی

معماری Private MultiCloud Storage برای دسترسی به خدمات ابری طراحی شده است در حالی که به صورت فیزیکی داده ها را در سایت سازمانی یا در یک محفظه امن جداگانه از مرکز داده با استفاده از یک سرویس کولوکیشن قرار می دهد. در اصل، این یک مدل محاسباتی توزیع‌شده مبتنی بر داده است که در آن سرورهای ابری با سیستم‌های ذخیره‌سازی راه دور از یک ابر خصوصی کار می‌کنند. بر این اساس، با استفاده از همان ذخیره‌سازی داده‌های محلی، می‌توانید با خدمات ابری از بزرگترین ارائه‌دهندگان کار کنید: AWS، MS Azure، Google Cloud Platform‎ و غیره.

با نمایش نمونه‌ای از پیاده‌سازی PMCS در نمایشگاه Supercomputing-2019، کینگستون نمونه‌ای از یک سیستم ذخیره‌سازی داده با کارایی بالا (SSD) مبتنی بر درایوهای SSD DC1000M را ارائه کرد و یکی از استارت‌آپ‌های ابری نرم‌افزار مدیریت StorOne S1 را برای نرم‌افزار ارائه کرد. ذخیره سازی تعریف شده و کانال های ارتباطی اختصاصی با ارائه دهندگان اصلی ابر.

لازم به ذکر است که PMCS، به عنوان یک مدل کار از محاسبات ابری با ذخیره سازی خصوصی، برای بازار آمریکای شمالی با اتصال شبکه توسعه یافته بین مراکز داده که در زیرساخت های AT&T و Equinix پشتیبانی می شود، طراحی شده است. بنابراین، پینگ بین یک سیستم ذخیره سازی کولوکیشن در هر گره Equinix Cloud Exchange و ابر AWS کمتر از 1 میلی ثانیه است (منبع: ITProToday).

در نمایش معماری PMCS نشان داده شده در نمایشگاه، سیستم ذخیره‌سازی روی دیسک‌های DC1000M NVMe به صورت کولوکیشن قرار گرفت و ماشین‌های مجازی در ابرهای AWS، MS Azure و Google Cloud Platform نصب شدند که یکدیگر را پینگ می‌کردند. برنامه کلاینت-سرور از راه دور با سیستم ذخیره سازی Kingston و سرورهای HP DL380 در مرکز داده کار می کرد و از طریق زیرساخت کانال ارتباطی Equinix به پلتفرم های ابری ارائه دهندگان اصلی فوق الذکر دسترسی پیدا کرد.

[ابر محاسبات 2019]. ذخیره سازی چند ابری به عنوان یک منطقه کاربردی برای درایوهای جدید Kingston DC1000M

اسلاید از ارائه Private MultiCloud Storage در نمایشگاه Supercomputing-2019. منبع: کینگستون

نرم افزاری با عملکرد مشابه برای مدیریت معماری ذخیره سازی چند ابری خصوصی توسط شرکت های مختلف ارائه شده است. اصطلاحات مربوط به این معماری همچنین می توانند متفاوت به نظر برسند - Private MultiCloud Storage یا Private Storage for Cloud.

کیت شیمنتی، مدیر مدیریت SSD سازمانی در کینگستون، گفت: «ابر رایانه‌های امروزی انواع برنامه‌های HPC را اجرا می‌کنند که در خط مقدم پیشرفت‌ها هستند، از اکتشاف نفت و گاز گرفته تا پیش‌بینی آب‌وهوا، بازارهای مالی و توسعه فناوری‌های جدید. این برنامه های HPC به تطابق بسیار بیشتری بین عملکرد پردازنده و سرعت I/O نیاز دارند. ما مفتخریم که به اشتراک بگذاریم که چگونه راه‌حل‌های کینگستون به پیشرفت در محاسبات کمک می‌کنند و عملکرد مورد نیاز را در شدیدترین محیط‌ها و برنامه‌های محاسباتی جهان ارائه می‌کنند.

درایو DC1000M و نمونه ای از یک سیستم ذخیره سازی مبتنی بر آن

SSD DC1000M U.2 NVMe توسط Kingston برای مرکز داده طراحی شده است و به طور خاص برای برنامه های کاربردی داده فشرده و HPC مانند برنامه های هوش مصنوعی (AI) و یادگیری ماشین (ML) طراحی شده است.

[ابر محاسبات 2019]. ذخیره سازی چند ابری به عنوان یک منطقه کاربردی برای درایوهای جدید Kingston DC1000M

درایو DC1000M U.2 NVMe 3.84 ترابایتی. منبع: کینگستون

درایوهای DC1000M U.2 مبتنی بر حافظه 96 لایه اینتل 3D NAND هستند که توسط یک کنترلر Silicon Motion SM2270 (PCIe 3.0 و NVMe 3.0) کنترل می شود. Silicon Motion SM2270 یک کنترلر NVMe شرکتی 16 لاین با رابط PCIe 3.0 x8، دو گذرگاه داده DRAM 32 بیتی و سه پردازنده دوگانه ARM Cortex R5 است.

DC1000M از ظرفیت های مختلف برای انتشار ارائه شده است: از 0.96 تا 7.68 ترابایت (به نظر می رسد محبوب ترین ظرفیت ها 3.84 و 7.68 ترابایت باشد). عملکرد درایو 800 هزار IOPS برآورد شده است.

[ابر محاسبات 2019]. ذخیره سازی چند ابری به عنوان یک منطقه کاربردی برای درایوهای جدید Kingston DC1000M

سیستم ذخیره سازی با 10x DC1000M U.2 NVMe 7.68 ترابایت. منبع: کینگستون

به عنوان نمونه ای از یک سیستم ذخیره سازی برای برنامه های HPC، کینگستون در Supercomputing 2019 یک راه حل رک با 10 درایو DC1000M U.2 NVMe، هر کدام با ظرفیت 7.68 ترابایت ارائه کرد. سیستم ذخیره سازی بر اساس SB122A-PH، یک پلت فرم عامل فرم 1U از AIC است. پردازنده‌ها: 2 x Intel Xeon CPU E5-2660، Kingston DRAM 128 GB (8x16 GB) DDR4-2400 (شماره قطعه: KSM24RS4/16HAI). سیستم عامل نصب شده اوبونتو 18.04.3 LTS، هسته لینوکس نسخه 5.0.0-31 است. تست gfio v3.13 (تستر I/O منعطف) عملکرد خواندن 5.8 میلیون IOPS با توان عملیاتی 23.8 گیگابیت بر ثانیه را نشان داد.

سیستم ذخیره سازی ارائه شده ویژگی های چشمگیری را از نظر خواندن پایدار 5,8 میلیون IOPS (عملیات ورودی-خروجی در ثانیه) نشان داد. این دو مرتبه سریعتر از SSD برای سیستم های بازار انبوه است. این سرعت خواندن برای برنامه های HPC در حال اجرا بر روی پردازنده های تخصصی مورد نیاز است.

رایانش ابری HPC با ذخیره سازی خصوصی در روسیه

وظیفه انجام محاسبات با کارایی بالا در ارائه‌دهنده، اما ذخیره فیزیکی داده‌های درون محل، برای شرکت‌های روسی نیز مرتبط است. یکی دیگر از موارد رایج در تجارت داخلی زمانی است که هنگام استفاده از خدمات ابری خارجی، داده ها باید در قلمرو فدراسیون روسیه قرار گیرند. ما از طرف ارائه‌دهنده ابر Selectel به عنوان شریک قدیمی کینگستون، در مورد این موقعیت‌ها نظر خواستیم.

در روسیه، امکان ساخت یک معماری مشابه با خدمات به زبان روسی و کلیه اسناد گزارش دهی برای بخش حسابداری مشتری وجود دارد. اگر یک شرکت نیاز به انجام محاسبات با کارایی بالا با استفاده از سیستم‌های ذخیره‌سازی داخلی دارد، ما در Selectel سرورهایی با انواع پردازنده‌هایی از جمله FPGA, GPU یا پردازنده های چند هسته ای علاوه بر این، از طریق شرکا، ما ایجاد یک کانال نوری اختصاصی بین دفتر مشتری و مرکز داده خود را سازماندهی می کنیم. — مشتری همچنین می‌تواند سیستم ذخیره‌سازی خود را در یک اتاق کامپیوتر با حالت دسترسی ویژه قرار دهد و برنامه‌ها را هم در سرورهای ما و هم در ابرهای ارائه‌دهندگان جهانی AWS، MS Azure، Google Cloud اجرا کند. البته تأخیر سیگنال در مورد دوم بیشتر از زمانی است که سیستم ذخیره سازی مشتری در ایالات متحده آمریکا قرار داشته باشد، اما یک اتصال چند ابری باند پهن ارائه خواهد شد.

در مقاله بعدی در مورد راه حل دیگری از کینگستون صحبت خواهیم کرد که در نمایشگاه Supercomputing 2019 (دنور، کلرادو، ایالات متحده آمریکا) ارائه شد و برای برنامه های یادگیری ماشین و تجزیه و تحلیل داده های بزرگ با استفاده از GPU در نظر گرفته شده است. این فناوری GPUDirect Storage است که انتقال مستقیم داده را بین حافظه NVMe و حافظه پردازنده GPU فراهم می کند. و علاوه بر این، توضیح خواهیم داد که چگونه توانستیم به سرعت خواندن اطلاعات 5.8 میلیون IOPS در یک سیستم ذخیره سازی رک روی دیسک های NVMe دست پیدا کنیم.

برای اطلاعات بیشتر در مورد محصولات Kingston Technology با: سایت شرکت.

منبع: www.habr.com

اضافه کردن نظر