تصور کنید که یک تجارت پزشکی نوآورانه راه اندازی می کنید - انتخاب فردی از داروها بر اساس تجزیه و تحلیل ژنوم انسان. هر بیمار 3 میلیارد جفت ژن دارد و یک سرور معمولی روی پردازنده های x86 چندین روز طول می کشد تا محاسبه شود. میدانید که میتوانید با یک پردازنده FPGA که محاسبات را در هزاران رشته موازی میکند، فرآیند را در سرور افزایش دهید. این محاسبه ژنوم را در حدود یک ساعت کامل می کند. چنین سرورهایی را می توان از خدمات وب آمازون (AWS) اجاره کرد. اما نکته اینجاست: مشتری، بیمارستان، قاطعانه مخالف قرار دادن داده های ژنتیکی در ابر ارائه دهنده است. باید چکار کنم؟ کینگستون و استارتاپ ابری معماری را در نمایشگاه Supercomputing-2019 به نمایش گذاشتند
سه شرط برای محاسبات با کارایی بالا
محاسبه ژنوم انسان تنها وظیفه در زمینه محاسبات با عملکرد بالا (HPC، High Performance Computing) نیست. دانشمندان میدان های فیزیکی را محاسبه می کنند، مهندسان قطعات هواپیما را محاسبه می کنند، سرمایه داران مدل های اقتصادی را محاسبه می کنند، و با هم داده های بزرگ را تجزیه و تحلیل می کنند، شبکه های عصبی می سازند، و بسیاری از محاسبات پیچیده دیگر را انجام می دهند.
سه شرط HPC عبارتند از قدرت محاسباتی بسیار زیاد، ذخیره سازی بسیار بزرگ و سریع و توان عملیاتی بالای شبکه. بنابراین، روش استاندارد برای انجام محاسبات LPC در مرکز داده خود شرکت (در محل) یا در یک ارائه دهنده در فضای ابری است.
اما همه شرکتها مراکز داده مخصوص به خود را ندارند و آنهایی که اغلب این کار را انجام میدهند از نظر کارایی منابع در مقایسه با مراکز داده تجاری پایینتر هستند (هزینههای سرمایه برای خرید و بهروزرسانی سختافزار و نرمافزار، پرداخت برای پرسنل با مهارت بالا و غیره مورد نیاز است). برعکس، ارائه دهندگان ابری، منابع فناوری اطلاعات را بر اساس مدل هزینه عملیاتی «پرداخت در زمان خرید» ارائه می کنند، یعنی. اجاره فقط برای مدت استفاده شارژ می شود. پس از تکمیل محاسبات، سرورها را می توان از حساب حذف کرد و بدین ترتیب در بودجه IT صرفه جویی کرد. اما اگر ممنوعیت قانونی یا شرکتی برای انتقال داده به ارائه دهنده وجود داشته باشد، محاسبات HPC در فضای ابری در دسترس نیست.
فضای ذخیره سازی چند ابری خصوصی
معماری Private MultiCloud Storage برای دسترسی به خدمات ابری طراحی شده است در حالی که به صورت فیزیکی داده ها را در سایت سازمانی یا در یک محفظه امن جداگانه از مرکز داده با استفاده از یک سرویس کولوکیشن قرار می دهد. در اصل، این یک مدل محاسباتی توزیعشده مبتنی بر داده است که در آن سرورهای ابری با سیستمهای ذخیرهسازی راه دور از یک ابر خصوصی کار میکنند. بر این اساس، با استفاده از همان ذخیرهسازی دادههای محلی، میتوانید با خدمات ابری از بزرگترین ارائهدهندگان کار کنید: AWS، MS Azure، Google Cloud Platform و غیره.
با نمایش نمونهای از پیادهسازی PMCS در نمایشگاه Supercomputing-2019، کینگستون نمونهای از یک سیستم ذخیرهسازی داده با کارایی بالا (SSD) مبتنی بر درایوهای SSD DC1000M را ارائه کرد و یکی از استارتآپهای ابری نرمافزار مدیریت StorOne S1 را برای نرمافزار ارائه کرد. ذخیره سازی تعریف شده و کانال های ارتباطی اختصاصی با ارائه دهندگان اصلی ابر.
لازم به ذکر است که PMCS، به عنوان یک مدل کار از محاسبات ابری با ذخیره سازی خصوصی، برای بازار آمریکای شمالی با اتصال شبکه توسعه یافته بین مراکز داده که در زیرساخت های AT&T و Equinix پشتیبانی می شود، طراحی شده است. بنابراین، پینگ بین یک سیستم ذخیره سازی کولوکیشن در هر گره Equinix Cloud Exchange و ابر AWS کمتر از 1 میلی ثانیه است (منبع:
در نمایش معماری PMCS نشان داده شده در نمایشگاه، سیستم ذخیرهسازی روی دیسکهای DC1000M NVMe به صورت کولوکیشن قرار گرفت و ماشینهای مجازی در ابرهای AWS، MS Azure و Google Cloud Platform نصب شدند که یکدیگر را پینگ میکردند. برنامه کلاینت-سرور از راه دور با سیستم ذخیره سازی Kingston و سرورهای HP DL380 در مرکز داده کار می کرد و از طریق زیرساخت کانال ارتباطی Equinix به پلتفرم های ابری ارائه دهندگان اصلی فوق الذکر دسترسی پیدا کرد.
اسلاید از ارائه Private MultiCloud Storage در نمایشگاه Supercomputing-2019. منبع: کینگستون
نرم افزاری با عملکرد مشابه برای مدیریت معماری ذخیره سازی چند ابری خصوصی توسط شرکت های مختلف ارائه شده است. اصطلاحات مربوط به این معماری همچنین می توانند متفاوت به نظر برسند - Private MultiCloud Storage یا Private Storage for Cloud.
کیت شیمنتی، مدیر مدیریت SSD سازمانی در کینگستون، گفت: «ابر رایانههای امروزی انواع برنامههای HPC را اجرا میکنند که در خط مقدم پیشرفتها هستند، از اکتشاف نفت و گاز گرفته تا پیشبینی آبوهوا، بازارهای مالی و توسعه فناوریهای جدید. این برنامه های HPC به تطابق بسیار بیشتری بین عملکرد پردازنده و سرعت I/O نیاز دارند. ما مفتخریم که به اشتراک بگذاریم که چگونه راهحلهای کینگستون به پیشرفت در محاسبات کمک میکنند و عملکرد مورد نیاز را در شدیدترین محیطها و برنامههای محاسباتی جهان ارائه میکنند.
درایو DC1000M و نمونه ای از یک سیستم ذخیره سازی مبتنی بر آن
SSD DC1000M U.2 NVMe توسط Kingston برای مرکز داده طراحی شده است و به طور خاص برای برنامه های کاربردی داده فشرده و HPC مانند برنامه های هوش مصنوعی (AI) و یادگیری ماشین (ML) طراحی شده است.
درایو DC1000M U.2 NVMe 3.84 ترابایتی. منبع: کینگستون
درایوهای DC1000M U.2 مبتنی بر حافظه 96 لایه اینتل 3D NAND هستند که توسط یک کنترلر Silicon Motion SM2270 (PCIe 3.0 و NVMe 3.0) کنترل می شود. Silicon Motion SM2270 یک کنترلر NVMe شرکتی 16 لاین با رابط PCIe 3.0 x8، دو گذرگاه داده DRAM 32 بیتی و سه پردازنده دوگانه ARM Cortex R5 است.
DC1000M از ظرفیت های مختلف برای انتشار ارائه شده است: از 0.96 تا 7.68 ترابایت (به نظر می رسد محبوب ترین ظرفیت ها 3.84 و 7.68 ترابایت باشد). عملکرد درایو 800 هزار IOPS برآورد شده است.
سیستم ذخیره سازی با 10x DC1000M U.2 NVMe 7.68 ترابایت. منبع: کینگستون
به عنوان نمونه ای از یک سیستم ذخیره سازی برای برنامه های HPC، کینگستون در Supercomputing 2019 یک راه حل رک با 10 درایو DC1000M U.2 NVMe، هر کدام با ظرفیت 7.68 ترابایت ارائه کرد. سیستم ذخیره سازی بر اساس SB122A-PH، یک پلت فرم عامل فرم 1U از AIC است. پردازندهها: 2 x Intel Xeon CPU E5-2660، Kingston DRAM 128 GB (8x16 GB) DDR4-2400 (شماره قطعه: KSM24RS4/16HAI). سیستم عامل نصب شده اوبونتو 18.04.3 LTS، هسته لینوکس نسخه 5.0.0-31 است. تست gfio v3.13 (تستر I/O منعطف) عملکرد خواندن 5.8 میلیون IOPS با توان عملیاتی 23.8 گیگابیت بر ثانیه را نشان داد.
سیستم ذخیره سازی ارائه شده ویژگی های چشمگیری را از نظر خواندن پایدار 5,8 میلیون IOPS (عملیات ورودی-خروجی در ثانیه) نشان داد. این دو مرتبه سریعتر از SSD برای سیستم های بازار انبوه است. این سرعت خواندن برای برنامه های HPC در حال اجرا بر روی پردازنده های تخصصی مورد نیاز است.
رایانش ابری HPC با ذخیره سازی خصوصی در روسیه
وظیفه انجام محاسبات با کارایی بالا در ارائهدهنده، اما ذخیره فیزیکی دادههای درون محل، برای شرکتهای روسی نیز مرتبط است. یکی دیگر از موارد رایج در تجارت داخلی زمانی است که هنگام استفاده از خدمات ابری خارجی، داده ها باید در قلمرو فدراسیون روسیه قرار گیرند. ما از طرف ارائهدهنده ابر Selectel به عنوان شریک قدیمی کینگستون، در مورد این موقعیتها نظر خواستیم.
در روسیه، امکان ساخت یک معماری مشابه با خدمات به زبان روسی و کلیه اسناد گزارش دهی برای بخش حسابداری مشتری وجود دارد. اگر یک شرکت نیاز به انجام محاسبات با کارایی بالا با استفاده از سیستمهای ذخیرهسازی داخلی دارد، ما در Selectel سرورهایی با انواع پردازندههایی از جمله
در مقاله بعدی در مورد راه حل دیگری از کینگستون صحبت خواهیم کرد که در نمایشگاه Supercomputing 2019 (دنور، کلرادو، ایالات متحده آمریکا) ارائه شد و برای برنامه های یادگیری ماشین و تجزیه و تحلیل داده های بزرگ با استفاده از GPU در نظر گرفته شده است. این فناوری GPUDirect Storage است که انتقال مستقیم داده را بین حافظه NVMe و حافظه پردازنده GPU فراهم می کند. و علاوه بر این، توضیح خواهیم داد که چگونه توانستیم به سرعت خواندن اطلاعات 5.8 میلیون IOPS در یک سیستم ذخیره سازی رک روی دیسک های NVMe دست پیدا کنیم.
برای اطلاعات بیشتر در مورد محصولات Kingston Technology با:
منبع: www.habr.com