IOPS milioni 5.8: kwa nini nyingi?

Habari Habr! Seti za data za Data Kubwa na kujifunza kwa mashine zinakua kwa kasi na tunahitaji kuendelea nazo. Chapisho letu kuhusu teknolojia nyingine ya kibunifu katika uwanja wa utendakazi wa hali ya juu (HPC, High Performance Computing), iliyoonyeshwa kwenye kibanda cha Kingston huko. Supercomputing-2019. Haya ni matumizi ya mifumo ya hifadhi ya data ya Hi-End (SDS) katika seva zilizo na vitengo vya usindikaji wa picha (GPU) na teknolojia ya basi ya Uhifadhi wa GPUDirect. Shukrani kwa ubadilishanaji wa data wa moja kwa moja kati ya mfumo wa hifadhi na GPU, kwa kukwepa CPU, upakiaji wa data kwenye vichapuzi vya GPU huharakishwa kwa mpangilio wa ukubwa, kwa hivyo programu za Data Kubwa hutekeleza utendakazi wa juu zaidi ambao GPU hutoa. Kwa upande mwingine, watengenezaji wa mfumo wa HPC wanapenda maendeleo katika mifumo ya hifadhi yenye kasi za juu zaidi za I/O, kama vile zinazozalishwa na Kingston.

IOPS milioni 5.8: kwa nini nyingi?

Utendaji wa GPU hupita upakiaji wa data

Kwa kuwa CUDA, usanifu wa msingi wa maunzi na programu ya kompyuta sambamba ya kutengeneza programu za madhumuni ya jumla ya CUDA, iliundwa mwaka wa 2007, uwezo wa maunzi wa GPU zenyewe umekua sana. Leo, GPU zinazidi kutumika katika programu za HPC kama vile Data Kubwa, kujifunza kwa mashine (ML), na kujifunza kwa kina (DL).

Kumbuka kuwa licha ya kufanana kwa maneno, mbili za mwisho ni kazi tofauti za algorithmically. ML hufunza kompyuta kulingana na data iliyopangwa, huku DL ikifunza kompyuta kulingana na maoni kutoka kwa mtandao wa neva. Mfano wa kusaidia kuelewa tofauti ni rahisi sana. Hebu tuchukue kwamba kompyuta lazima itofautishe kati ya picha za paka na mbwa ambazo zimepakiwa kutoka kwa mfumo wa kuhifadhi. Kwa ML, unapaswa kuwasilisha seti ya picha zilizo na lebo nyingi, ambazo kila moja inafafanua kipengele kimoja cha mnyama. Kwa DL, inatosha kupakia idadi kubwa zaidi ya picha, lakini kwa lebo moja tu "huyu ni paka" au "huyu ni mbwa". DL ni sawa na jinsi watoto wachanga wanavyofundishwa - huonyeshwa tu picha za mbwa na paka katika vitabu na katika maisha (mara nyingi, bila hata kuelezea tofauti ya kina), na ubongo wa mtoto yenyewe huanza kuamua aina ya mnyama baada ya. idadi fulani muhimu ya picha kwa kulinganisha ( Kulingana na makadirio, tunazungumza juu ya maonyesho mia moja au mbili tu katika utoto wa mapema). Algoriti za DL bado si kamilifu sana: ili mtandao wa neva pia ufanye kazi kwa mafanikio katika kutambua picha, ni muhimu kulisha na kuchakata mamilioni ya picha kwenye GPU.

Muhtasari wa utangulizi: kulingana na GPU, unaweza kuunda programu za HPC katika uwanja wa Data Kubwa, ML na DL, lakini kuna tatizo - seti za data ni kubwa sana hivi kwamba muda uliotumika kupakia data kutoka kwa mfumo wa hifadhi hadi GPU. huanza kupunguza utendaji wa jumla wa programu. Kwa maneno mengine, GPU za haraka husalia kutotumika kwa sababu ya data ya polepole ya I/O inayotoka kwa mifumo mingine midogo. Tofauti katika kasi ya I/O ya GPU na basi kwenda kwa CPU/mfumo wa hifadhi inaweza kuwa mpangilio wa ukubwa.

Je, teknolojia ya Uhifadhi wa GPUDirect inafanyaje kazi?

Mchakato wa I/O unadhibitiwa na CPU, kama vile mchakato wa kupakia data kutoka kwa hifadhi hadi GPU kwa usindikaji zaidi. Hii ilisababisha ombi la teknolojia ambayo ingetoa ufikiaji wa moja kwa moja kati ya GPU na viendeshi vya NVMe ili kuwasiliana kwa haraka. NVIDIA ilikuwa ya kwanza kutoa teknolojia kama hiyo na ikaiita Hifadhi ya GPUDirect. Kwa kweli, hii ni tofauti ya teknolojia ya GPUDirect RDMA (Anwani ya Kumbukumbu ya Mbali) waliyotengeneza hapo awali.

IOPS milioni 5.8: kwa nini nyingi?
Jensen Huang, Mkurugenzi Mtendaji wa NVIDIA, atawasilisha Hifadhi ya GPUDirect kama kibadala cha GPUDirect RDMA katika SC-19. Chanzo: NVIDIA

Tofauti kati ya GPUDirect RDMA na Hifadhi ya GPUDirect iko kwenye vifaa kati ya ambayo anwani hufanywa. Teknolojia ya GPUDirect RDMA inakusudiwa tena kusogeza data moja kwa moja kati ya kadi ya kiolesura cha mbele cha mtandao (NIC) na kumbukumbu ya GPU, na Hifadhi ya GPUDirect hutoa njia ya moja kwa moja ya data kati ya hifadhi ya ndani au ya mbali kama vile NVMe au NVMe kupitia Fabric (NVMe-oF) na Kumbukumbu ya GPU.

GPUDirect RDMA na Hifadhi ya GPUDirect huepuka uhamishaji wa data usio wa lazima kupitia bafa katika kumbukumbu ya CPU na kuruhusu utaratibu wa ufikiaji wa kumbukumbu ya moja kwa moja (DMA) kuhamisha data kutoka kwa kadi ya mtandao au hifadhi moja kwa moja hadi au kutoka kwa kumbukumbu ya GPU - yote bila kupakiwa kwenye CPU kuu. Kwa Hifadhi ya GPUDirect, eneo la hifadhi haijalishi: inaweza kuwa diski ya NVME ndani ya kitengo cha GPU, ndani ya rack, au kuunganishwa kwenye mtandao kama NVMe-oF.

IOPS milioni 5.8: kwa nini nyingi?
Mpango wa uendeshaji wa Hifadhi ya GPUDirect. Chanzo: NVIDIA

Mifumo ya hifadhi ya Hi-End kwenye NVMe inahitajika katika soko la programu za HPC

Kwa kutambua kwamba ujio wa Hifadhi ya GPUDirect, wateja wakubwa watavutiwa na kutoa mifumo ya uhifadhi yenye kasi ya I/O inayolingana na utendakazi wa GPU, katika maonyesho ya SC-19 Kingston alionyesha onyesho la mfumo unaojumuisha mfumo wa kuhifadhi kulingana na diski za NVMe na kitengo chenye GPU, ambacho kilichanganua maelfu ya picha za setilaiti kwa sekunde. Tayari tumeandika kuhusu mfumo kama huo wa kuhifadhi kulingana na viendeshi 10 vya DC1000M U.2 NVMe katika ripoti kutoka kwa maonyesho ya kompyuta kubwa.

IOPS milioni 5.8: kwa nini nyingi?
Mfumo wa kuhifadhi kulingana na viendeshi 10 vya DC1000M U.2 NVMe hukamilisha ipasavyo seva iliyo na vichapuzi vya michoro. Chanzo: Kingston

Mfumo huu wa kuhifadhi umeundwa kama rack ya 1U au kitengo kikubwa zaidi na unaweza kuongezwa kulingana na idadi ya viendeshi vya DC1000M U.2 NVMe, kila moja ikiwa na uwezo wa 3.84-7.68 TB. DC1000M ndiyo modeli ya kwanza ya NVMe SSD katika kipengee cha umbo la U.2 katika safu ya Kingston ya viendeshi vya kituo cha data. Ina ukadiriaji wa ustahimilivu (DWPD, Hifadhi huandika kwa siku), ikiiruhusu kuandika upya data kwa uwezo wake kamili mara moja kwa siku kwa maisha ya uhakika ya hifadhi.

Katika jaribio la fio v3.13 kwenye mfumo wa uendeshaji wa Ubuntu 18.04.3 LTS, Linux kernel 5.0.0-31-generic, sampuli ya uhifadhi wa maonyesho ilionyesha kasi ya kusoma (Sustained Read) ya IOPS milioni 5.8 na upitishaji endelevu (Sustained Bandwidth ) ya 23.8 Gbit/s.

Ariel Perez, meneja wa biashara wa SSD huko Kingston, alisema kuhusu mifumo mipya ya uhifadhi: "Tuko tayari kuandaa kizazi kijacho cha seva na suluhu za U.2 NVMe SSD ili kuondoa vikwazo vingi vya uhamishaji data ambavyo kijadi vimehusishwa na uhifadhi. Mchanganyiko wa viendeshi vya NVMe SSD na DRAM ya Seva yetu kuu ya kwanza inamfanya Kingston kuwa mmoja wa watoa huduma wa kina wa utatuzi wa data wa mwisho hadi mwisho wa tasnia.

IOPS milioni 5.8: kwa nini nyingi?
Jaribio la gfio v3.13 lilionyesha upitishaji wa Gbps 23.8 kwa mfumo wa hifadhi ya onyesho kwenye viendeshi vya DC1000M U.2 NVMe. Chanzo: Kingston

Je, mfumo wa kawaida wa programu za HPC ungeonekanaje kutumia Hifadhi ya GPUDirect au teknolojia sawa? Huu ni usanifu ulio na mgawanyo halisi wa vitengo vya utendaji ndani ya rack: uniti moja au mbili kwa RAM, kadhaa zaidi kwa GPU na nodi za kompyuta za CPU, na kitengo kimoja au zaidi cha mifumo ya kuhifadhi.

Kwa kutangazwa kwa Hifadhi ya GPUDirect na uwezekano wa kuibuka kwa teknolojia kama hizo kutoka kwa wachuuzi wengine wa GPU, hitaji la Kingston la mifumo ya hifadhi iliyoundwa kwa ajili ya matumizi ya kompyuta yenye utendaji wa juu linaongezeka. Alama itakuwa kasi ya kusoma data kutoka kwa mfumo wa kuhifadhi, ikilinganishwa na upitishaji wa kadi za mtandao za 40- au 100-Gbit kwenye mlango wa kitengo cha kompyuta na GPU. Kwa hivyo, mifumo ya uhifadhi wa kasi ya juu, ikijumuisha NVMe ya nje kupitia Kitambaa, itatoka kuwa ya kigeni hadi ya kawaida kwa programu za HPC. Mbali na hesabu za sayansi na fedha, watapata matumizi katika maeneo mengine mengi ya kiutendaji, kama vile mifumo ya usalama katika ngazi ya jiji la Safe City au vituo vya uchunguzi wa usafiri, ambapo utambuzi na kasi ya utambuzi wa mamilioni ya picha za HD kwa sekunde inahitajika,” imeelezwa. niche ya soko ya mfumo wa juu wa Uhifadhi

Maelezo zaidi kuhusu bidhaa za Kingston yanaweza kupatikana kwa tovuti rasmi kampuni hiyo.

Chanzo: mapenzi.com

Kuongeza maoni