🥇5.8 miljoni IOPS: kāpēc tik daudz?

Sveiks, Habr! Datu kopas lielajiem datiem un mašīnmācībai pieaug eksponenciāli, un mums ir jāseko tām līdzi. Mūsu ieraksts par citu inovatīvu tehnoloģiju augstas veiktspējas skaitļošanas jomā (HPC, High Performance Computing), kas parādīts Kingstonas stendā plkst. Superskaitļošana — 2019. Tas ir Hi-End datu uzglabāšanas sistēmu (SDS) izmantošana serveros ar grafiskām apstrādes vienībām (GPU) un GPUDirect Storage kopnes tehnoloģiju. Pateicoties tiešai datu apmaiņai starp uzglabāšanas sistēmu un GPU, apejot centrālo procesoru, datu ielāde GPU paātrinātājos tiek paātrināta par lielumu, tāpēc Big Data lietojumprogrammas darbojas ar maksimālo veiktspēju, ko nodrošina GPU. Savukārt HPC sistēmu izstrādātājus interesē sasniegumi uzglabāšanas sistēmās ar vislielāko I/O ātrumu, piemēram, Kingston ražotajās.

5.8 miljoni IOPS: kāpēc tik daudz?

GPU veiktspēja pārsniedz datu ielādi

Kopš 2007. gadā tika izveidota CUDA — uz GPU balstīta aparatūras un programmatūras paralēlās skaitļošanas arhitektūra vispārējas nozīmes lietojumprogrammu izstrādei, pašu GPU aparatūras iespējas ir neticami pieaugušas. Mūsdienās GPU arvien vairāk izmanto HPC lietojumprogrammās, piemēram, Big Data, mašīnmācībā (ML) un dziļajā mācībā (DL).

Ņemiet vērā, ka, neskatoties uz terminu līdzību, pēdējie divi ir algoritmiski atšķirīgi uzdevumi. ML apmāca datoru, pamatojoties uz strukturētiem datiem, savukārt DL apmāca datoru, pamatojoties uz atgriezenisko saiti no neironu tīkla. Piemērs, kas palīdz izprast atšķirības, ir pavisam vienkāršs. Pieņemsim, ka datoram ir jānošķir kaķu un suņu fotogrāfijas, kas tiek ielādētas no uzglabāšanas sistēmas. Attiecībā uz ML jums ir jāiesniedz attēlu kopa ar daudziem tagiem, no kuriem katrs nosaka vienu konkrētu dzīvnieka pazīmi. DL gadījumā pietiek augšupielādēt daudz lielāku attēlu skaitu, bet tikai ar vienu atzīmi “tas ir kaķis” vai “tas ir suns”. DL ir ļoti līdzīgs tam, kā tiek mācīti mazi bērni - viņiem vienkārši tiek parādīti suņu un kaķu attēli grāmatās un dzīvē (visbiežāk, pat nepaskaidrojot sīkāku atšķirību), un bērna smadzenes pašas sāk noteikt dzīvnieka tipu pēc tam, kad noteikts kritisks attēlu skaits salīdzināšanai (Pēc aplēsēm, mēs runājam tikai par simts vai divām izrādēm visā agrā bērnībā). DL algoritmi vēl nav tik perfekti: lai neironu tīkls veiksmīgi strādātu arī pie attēlu identificēšanas, ir nepieciešams ievadīt un apstrādāt miljoniem attēlu GPU.

Priekšvārda kopsavilkums: pamatojoties uz GPU, var veidot HPC lietojumprogrammas Big Data, ML un DL jomā, taču ir problēma - datu kopas ir tik lielas, ka laiks, kas tiek patērēts datu ielādei no uzglabāšanas sistēmas uz GPU sāk samazināt lietojumprogrammas vispārējo veiktspēju. Citiem vārdiem sakot, ātrie GPU joprojām netiek izmantoti, jo lēni I/O dati nāk no citām apakšsistēmām. GPU un CPU/atmiņas sistēmas kopnes I/O ātruma atšķirība var būt par lielumu.

Kā darbojas GPUDirect Storage tehnoloģija?

I/O procesu kontrolē CPU, tāpat kā datu ielādes procesu no krātuves uz GPU turpmākai apstrādei. Tā rezultātā tika pieprasīta tehnoloģija, kas nodrošinātu tiešu piekļuvi starp GPU un NVMe diskdziņiem, lai ātri sazinātos viens ar otru. NVIDIA bija pirmā, kas piedāvāja šādu tehnoloģiju un nosauca to par GPUDirect Storage. Faktiski šī ir iepriekš izstrādātās GPUDirect RDMA (Remote Direct Memory Address) tehnoloģijas variācija.

5.8 miljoni IOPS: kāpēc tik daudz?
Jensens Huangs, NVIDIA izpilddirektors, izstādē SC-19 prezentēs GPUDirect Storage kā GPUDirect RDMA variantu. Avots: NVIDIA

Atšķirība starp GPUDirect RDMA un GPUDirect Storage ir ierīcēs, starp kurām tiek veikta adresēšana. GPUDirect RDMA tehnoloģija ir pārveidota, lai pārvietotu datus tieši starp priekšējās tīkla interfeisa karti (NIC) un GPU atmiņu, un GPUDirect Storage nodrošina tiešu datu ceļu starp lokālo vai attālo krātuvi, piemēram, NVMe vai NVMe over Fabric (NVMe-oF) un GPU atmiņa.

Gan GPUDirect RDMA, gan GPUDirect Storage novērš nevajadzīgu datu pārvietošanu caur buferi CPU atmiņā un ļauj tiešās atmiņas piekļuves (DMA) mehānismam pārvietot datus no tīkla kartes vai krātuves tieši uz GPU atmiņu vai no tās — tas viss notiek bez centrālā CPU slodzes. Attiecībā uz GPUDirect Storage krātuves atrašanās vietai nav nozīmes: tas var būt NVME disks GPU blokā, statīva iekšpusē vai savienots tīklā kā NVMe-oF.

5.8 miljoni IOPS: kāpēc tik daudz?
GPUDirect Storage darbības shēma. Avots: NVIDIA

Augstākās klases atmiņas sistēmas NVMe ir pieprasītas HPC lietojumprogrammu tirgū

Apzinoties, ka līdz ar GPUDirect Storage parādīšanos lielo klientu interese tiks piesaistīta glabāšanas sistēmu piedāvāšanai ar I/O ātrumu, kas atbilst GPU caurlaidspējai, izstādē SC-19 Kingston demonstrēja sistēmas demonstrāciju, kas sastāv no uzglabāšanas sistēma, kuras pamatā ir NVMe diski un vienība ar GPU, kas analizēja tūkstošiem satelītattēlu sekundē. Mēs jau rakstījām par šādu uzglabāšanas sistēmu, kuras pamatā ir 10 DC1000M U.2 NVMe diskdziņi reportāžā no superdatoru izstādes.

5.8 miljoni IOPS: kāpēc tik daudz?
Uzglabāšanas sistēma, kuras pamatā ir 10 DC1000M U.2 NVMe diskdziņi, pienācīgi papildina serveri ar grafikas paātrinātājiem. Avots: Kingston

Šī uzglabāšanas sistēma ir veidota kā 1 U vai lielāka statīva vienība, un to var mērogot atkarībā no DC1000M U.2 NVMe diskdziņu skaita, katrs ar ietilpību 3.84–7.68 TB. DC1000M ir pirmais NVMe SSD modelis U.2 formas faktorā Kingstonas datu centru disku sērijā. Tam ir izturības novērtējums (DWPD, disks raksta dienā), kas ļauj pārrakstīt datus uz pilnu jaudu reizi dienā garantētā diska kalpošanas laikā.

Fio v3.13 testā operētājsistēmā Ubuntu 18.04.3 LTS, Linux Ar kodola 5.0.0-31-generic versiju krātuves sistēmas demonstrācijas paraugs uzrādīja lasīšanas ātrumu (Sustained Read) 5.8 miljoni IOPS ar ilgtspējīgu caurlaidspēju (Sustained Bandwidth) 23.8 Gbps.

Ariels Peress, Kingstonas SSD biznesa vadītājs, par jaunajām uzglabāšanas sistēmām teica: “Mēs esam gatavi aprīkot nākamās paaudzes serverus ar U.2 NVMe SSD risinājumiem, lai novērstu daudzas datu pārraides vājās vietas, kas tradicionāli ir saistītas ar uzglabāšanu. NVMe SSD disku un mūsu augstākās kvalitātes Server Premier DRAM kombinācija padara Kingston par vienu no nozares visaptverošākajiem pilnīgu datu risinājumu nodrošinātājiem.

5.8 miljoni IOPS: kāpēc tik daudz?
Gfio v3.13 tests uzrādīja 23.8 Gb/s caurlaidspēju demo krātuves sistēmai DC1000M U.2 NVMe diskdziņiem. Avots: Kingston

Kā izskatītos tipiska sistēma HPC lietojumprogrammām, izmantojot GPUDirect Storage vai līdzīgu tehnoloģiju? Šī ir arhitektūra ar funkcionālo vienību fizisku atdalīšanu statīvā: viena vai divas vienības RAM, vairākas citas GPU un CPU skaitļošanas mezgliem un viena vai vairākas vienības uzglabāšanas sistēmām.

Līdz ar paziņojumu par GPUDirect Storage un iespējamu līdzīgu tehnoloģiju parādīšanos no citiem GPU pārdevējiem, Kingston pieprasījums pēc uzglabāšanas sistēmām, kas paredzētas izmantošanai augstas veiktspējas skaitļošanā, palielinās. Marķieris būs datu nolasīšanas ātrums no uzglabāšanas sistēmas, kas ir salīdzināms ar 40 vai 100 Gbit tīkla karšu caurlaidspēju pie ieejas skaitļošanas blokā ar GPU. Tādējādi īpaši ātrgaitas uzglabāšanas sistēmas, tostarp ārējā NVMe, izmantojot Fabric, kļūs no eksotiskām par HPC lietojumprogrammu galvenajām sistēmām. Papildus zinātnei un finanšu aprēķiniem tie atradīs pielietojumu daudzās citās praktiskās jomās, piemēram, drošības sistēmās Drošas pilsētas lielpilsētu līmenī vai transporta novērošanas centros, kur ir nepieciešams miljoniem HD attēlu atpazīšanas un identifikācijas ātrums sekundē,” norādīja. augstākās uzglabāšanas sistēmas tirgus niša

Vairāk informācijas par Kingston produktiem var atrast oficiālā vietne uzņēmums.

Avots: www.habr.com