NÄkotne ir pienÄkusi, un mÄkslÄ«go intelektu un maŔīnmÄcÄ«Å”anÄs tehnoloÄ£ijas jau veiksmÄ«gi izmanto jÅ«su iecienÄ«tÄkie veikali, transporta uzÅÄmumi un pat tÄ«taru fermas.
Un ja kaut kas eksistÄ, tad internetÄ jau kaut kas par to ir... atklÄts projekts! Skatiet, kÄ Open Data Hub palÄ«dz paplaÅ”inÄt jaunas tehnoloÄ£ijas un izvairÄ«ties no ievieÅ”anas problÄmÄm.
Ar visÄm mÄkslÄ«gÄ intelekta (AI) un maŔīnmÄcÄ«Å”anÄs (ML) priekÅ”rocÄ«bÄm organizÄcijÄm bieži ir grÅ«tÄ«bas pielÄgot Ŕīs tehnoloÄ£ijas. GalvenÄs problÄmas Å”ajÄ gadÄ«jumÄ parasti ir Å”Ädas:
- InformÄcijas apmaiÅa un sadarbÄ«ba ā ir gandrÄ«z neiespÄjami bez piepÅ«les apmainÄ«ties ar informÄciju un sadarboties ÄtrÄs iterÄcijÄs.
- Piekļuve datiem ā katram uzdevumam tas ir jÄveido no jauna un manuÄli, kas aizÅem daudz laika.
- Piekļuve pÄc pieprasÄ«juma ā nav iespÄjams pÄc pieprasÄ«juma iegÅ«t piekļuvi maŔīnmÄcÄ«bas rÄ«kiem un platformai, kÄ arÄ« skaitļoÅ”anas infrastruktÅ«rai.
- RažoÅ”ana ā modeļi paliek prototipa stadijÄ un netiek nodoti rÅ«pnieciskai lietoÅ”anai.
- Izsekojiet un izskaidrojiet AI rezultÄtus ā AI/ML rezultÄtu reproducÄjamÄ«ba, izsekoÅ”ana un izskaidroÅ”ana ir sarežģīta.
Ja Ŕīs problÄmas netiek risinÄtas, tÄs negatÄ«vi ietekmÄ vÄrtÄ«go datu zinÄtnieku Ätrumu, efektivitÄti un produktivitÄti. Tas noved pie viÅu neapmierinÄtÄ«bas, vilÅ”anÄs darbÄ, un rezultÄtÄ biznesa cerÄ«bas attiecÄ«bÄ uz AI/ML tiek zaudÄtas.
AtbildÄ«ba par Å”o problÄmu risinÄÅ”anu gulstas uz IT speciÄlistiem, kuriem ir jÄnodroÅ”ina datu analÄ«tiÄ·i ā tieÅ”i tÄ, kaut kas lÄ«dzÄ«gs mÄkonim. SÄ«kÄk, mums ir nepiecieÅ”ama platforma, kas nodroÅ”ina izvÄles brÄ«vÄ«bu un kurai ir Ärta, viegla piekļuve. TajÄ paÅ”Ä laikÄ tas ir Ätrs, viegli pÄrkonfigurÄjams, mÄrogojams pÄc pieprasÄ«juma un izturÄ«gs pret kļūmÄm. Å Ädas platformas izveide uz atvÄrtÄ pirmkoda tehnoloÄ£ijÄm palÄ«dz izvairÄ«ties no pÄrdevÄja bloÄ·ÄÅ”anas un saglabÄt ilgtermiÅa stratÄÄ£iskÄs priekÅ”rocÄ«bas izmaksu kontroles ziÅÄ.
Pirms dažiem gadiem kaut kas lÄ«dzÄ«gs notika lietojumprogrammu izstrÄdÄ un noveda pie mikropakalpojumu, hibrÄ«dmÄkoÅu, IT automatizÄcijas un veiklu procesu raÅ”anÄs. Lai ar to visu tiktu galÄ, IT speciÄlisti ir pievÄrsuÅ”ies konteineriem, Kubernetes un atvÄrtajiem hibrÄ«dmÄkoÅiem.
Å Ä« pieredze tagad tiek izmantota, lai atbildÄtu uz Al izaicinÄjumiem. TÄpÄc IT profesionÄļi veido platformas, kas ir balstÄ«tas uz konteineriem, ļauj izveidot AI/ML pakalpojumus elastÄ«gos procesos, paÄtrina inovÄcijas un ir veidotas, Åemot vÄrÄ hibrÄ«dmÄkoni.
MÄs sÄksim veidot Å”Ädu platformu, izmantojot Red Hat OpenShift, mÅ«su konteinerizÄto Kubernetes platformu hibrÄ«dam mÄkonim, kurÄ ir strauji augoÅ”a programmatÅ«ras un aparatÅ«ras ML risinÄjumu ekosistÄma (NVIDIA, H2O.ai, Starburst, PerceptiLabs utt.). Daži Red Hat klienti, piemÄram, BMW Group, ExxonMobil un citi, platformas un tÄs ekosistÄmas augÅ”pusÄ jau ir izvietojuÅ”i konteinerizÄtas ML rÄ«ku Ä·Ädes un DevOps procesus, lai ieviestu savu ML arhitektÅ«ru ražoÅ”anÄ un paÄtrinÄtu datu analÄ«tiÄ·u darbu.
VÄl viens iemesls, kÄpÄc mÄs uzsÄkÄm Open Data Hub projektu, ir parÄdÄ«t arhitektÅ«ras piemÄru, kura pamatÄ ir vairÄki atvÄrtÄ pirmkoda programmatÅ«ras projekti, un parÄdÄ«t, kÄ ieviest visu uz OpenShift platformu balstÄ«ta ML risinÄjuma dzÄ«ves ciklu.
Open Data Hub projekts
Å is ir atvÄrtÄ koda projekts, kas tiek izstrÄdÄts attiecÄ«gajÄ izstrÄdes kopienÄ un Ä«steno pilnu darbÄ«bu ciklu - no sÄkotnÄjo datu ielÄdes un pÄrveidoÅ”anas lÄ«dz modeļa Ä£enerÄÅ”anai, apmÄcÄ«bai un uzturÄÅ”anai -, risinot AI / ML problÄmas, izmantojot konteinerus un Kubernetes uz OpenShift. platforma. Å o projektu var uzskatÄ«t par atsauces ievieÅ”anu, piemÄru, kÄ izveidot atvÄrtu AI/ML-as-a-service risinÄjumu, kura pamatÄ ir OpenShift un saistÄ«tie atvÄrtÄ pirmkoda rÄ«ki, piemÄram, Tensorflow, JupyterHub, Spark un citi. Ir svarÄ«gi atzÄ«mÄt, ka pati Red Hat izmanto Å”o projektu, lai nodroÅ”inÄtu savus AI/ML pakalpojumus. TurklÄt OpenShift integrÄjas ar galvenajiem programmatÅ«ras un aparatÅ«ras ML risinÄjumiem no NVIDIA, Seldon, Starbust un citiem piegÄdÄtÄjiem, atvieglojot savu maŔīnmÄcÄ«Å”anÄs sistÄmu izveidi un darbinÄÅ”anu.
Open Data Hub projekts ir vÄrsts uz Å”ÄdÄm lietotÄju kategorijÄm un lietoÅ”anas gadÄ«jumiem:
- Datu analÄ«tiÄ·is, kuram nepiecieÅ”ams risinÄjums ML projektu Ä«stenoÅ”anai, organizÄts kÄ mÄkonis ar paÅ”apkalpoÅ”anÄs funkcijÄm.
- Datu analÄ«tiÄ·is, kuram nepiecieÅ”ama maksimÄla izvÄle no jaunÄkajiem atvÄrtÄ pirmkoda AI/ML rÄ«kiem un platformÄm.
- Datu analÄ«tiÄ·is, kuram, apmÄcot modeļus, nepiecieÅ”ama piekļuve datu avotiem.
- Datu analÄ«tiÄ·is, kuram nepiecieÅ”ama piekļuve skaitļoÅ”anas resursiem (CPU, GPU, atmiÅa).
- Datu analÄ«tiÄ·is, kuram nepiecieÅ”ama spÄja sadarboties un dalÄ«ties darbÄ ar kolÄÄ£iem, saÅemt atsauksmes un veikt uzlabojumus ÄtrÄ iterÄcijÄ.
- Datu analÄ«tiÄ·is, kurÅ” vÄlas sadarboties ar izstrÄdÄtÄjiem (un izstrÄdÄtÄju komandÄm), lai viÅa ML modeļi un darba rezultÄti nonÄktu ražoÅ”anÄ.
- Datu inženieris, kuram jÄnodroÅ”ina datu analÄ«tiÄ·im piekļuve dažÄdiem datu avotiem, vienlaikus ievÄrojot normatÄ«vÄs un droŔības prasÄ«bas.
- IT sistÄmas administrators/operators, kuram nepiecieÅ”ama spÄja bez piepÅ«les kontrolÄt atvÄrtÄ pirmkoda komponentu un tehnoloÄ£iju dzÄ«ves ciklu (instalÄÅ”ana, konfigurÄÅ”ana, jauninÄÅ”ana). Mums ir vajadzÄ«gi arÄ« atbilstoÅ”i pÄrvaldÄ«bas un kvotu instrumenti.
Open Data Hub projekts apvieno atvÄrtÄ pirmkoda rÄ«ku klÄstu, lai Ä«stenotu pilnu AI/ML darbÄ«bu ciklu. Jupyter Notebook Å”eit tiek izmantots kÄ galvenais datu analÄ«zes darba rÄ«ks. RÄ«ku komplekts mÅ«sdienÄs ir plaÅ”i populÄrs datu zinÄtnieku vidÅ«, un Open Data Hub ļauj viÅiem viegli izveidot un pÄrvaldÄ«t Jupyter Notebook darbvietas, izmantojot iebÅ«vÄto JupyterHub. Papildus Jupyter piezÄ«mju grÄmatiÅu izveidei un importÄÅ”anai Open Data Hub projektÄ ir arÄ« vairÄkas gatavas piezÄ«mju grÄmatiÅas AI bibliotÄkas veidÄ.
Å Ä« bibliotÄka ir atvÄrtÄ koda maŔīnmÄcÄ«Å”anÄs komponentu un risinÄjumu kolekcija izplatÄ«tiem scenÄrijiem, kas vienkÄrÅ”o Ätru prototipu izveidi. JupyterHub ir integrÄts OpenShift RBAC piekļuves modelÄ«, kas ļauj izmantot esoÅ”os OpenShift kontus un ieviest vienreizÄjo pierakstÄ«Å”anos. TurklÄt JupyterHub piedÄvÄ lietotÄjam draudzÄ«gu lietotÄja interfeisu, ko sauc par spawner, ar kura palÄ«dzÄ«bu lietotÄjs var viegli konfigurÄt skaitļoÅ”anas resursu apjomu (CPU kodoli, atmiÅa, GPU) atlasÄ«tajam Jupyter piezÄ«mjdatoram.
PÄc tam, kad datu analÄ«tiÄ·is ir izveidojis un konfigurÄjis klÄpjdatoru, visas pÄrÄjÄs ar to saistÄ«tÄs problÄmas risina Kubernetes plÄnotÄjs, kas ir daļa no OpenShift. LietotÄji var tikai veikt savus eksperimentus, saglabÄt un kopÄ«got sava darba rezultÄtus. TurklÄt pieredzÄjuÅ”i lietotÄji var tieÅ”i piekļūt OpenShift CLI apvalkam tieÅ”i no Jupyter piezÄ«mjdatoriem, lai izmantotu Kubernetes primitÄ«vus, piemÄram, Job vai OpenShift funkcionalitÄti, piemÄram, Tekton vai Knative. Vai arÄ« Å”im nolÅ«kam varat izmantot OpenShift Ärto GUI, ko sauc par āOpenShift tÄ«mekļa konsoliā.
PÄrejot uz nÄkamo posmu, Open Data Hub ļauj pÄrvaldÄ«t datu cauruļvadus. Å im nolÅ«kam tiek izmantots Ceph objekts, kas tiek nodroÅ”inÄts kÄ ar S3 saderÄ«ga objekta datu krÄtuve. Apache Spark ļauj straumÄt datus no ÄrÄjiem avotiem vai iebÅ«vÄtÄs Ceph S3 krÄtuves, kÄ arÄ« ļauj veikt provizoriskas datu transformÄcijas. Apache Kafka nodroÅ”ina uzlabotu datu cauruļvadu pÄrvaldÄ«bu (kur datus var ielÄdÄt vairÄkas reizes, kÄ arÄ« datu pÄrveidoÅ”anas, analÄ«zes un noturÄ«bas darbÄ«bas).
TÄtad datu analÄ«tiÄ·is piekļuva datiem un izveidoja modeli. Tagad viÅam ir vÄlme iegÅ«tajos rezultÄtos dalÄ«ties ar kolÄÄ£iem vai aplikÄciju izstrÄdÄtÄjiem un sniegt viÅiem savu modeli par pakalpojuma principiem. Tam nepiecieÅ”ams secinÄjumu serveris, un Open Data Hub ir Å”Äds serveris, to sauc par Seldon un ļauj publicÄt modeli kÄ RESTful pakalpojumu.
KÄdÄ brÄ«dÄ« Seldon serverÄ« ir vairÄki Å”Ädi modeļi, un ir jÄuzrauga, kÄ tie tiek izmantoti. Lai to panÄktu, Open Data Hub piedÄvÄ atbilstoÅ”u metrikas kolekciju un atskaiÅ”u programmu, kuras pamatÄ ir plaÅ”i izmantoti atvÄrtÄ koda uzraudzÄ«bas rÄ«ki Prometheus un Grafana. RezultÄtÄ mÄs saÅemam atsauksmes, lai uzraudzÄ«tu AI modeļu izmantoÅ”anu, jo Ä«paÅ”i ražoÅ”anas vidÄ.
TÄdÄ veidÄ Open Data Hub nodroÅ”ina mÄkoÅiem lÄ«dzÄ«gu pieeju visÄ AI/ML dzÄ«ves ciklÄ, sÄkot no datu piekļuves un sagatavoÅ”anas lÄ«dz modeļu apmÄcÄ«bai un ražoÅ”anai.
Viss kopÄ
Tagad rodas jautÄjums, kÄ to visu organizÄt OpenShift administratoram. Un Å”eit tiek izmantots Ä«paÅ”s Kubernetes operators Open Data Hub projektiem.
Å is operators pÄrvalda Open Data Hub projekta instalÄÅ”anu, konfigurÄÅ”anu un dzÄ«ves ciklu, tostarp iepriekÅ” minÄto rÄ«ku, piemÄram, JupyterHub, Ceph, Spark, Kafka, Seldon, Prometheus un Grafana, izvietoÅ”anu. Open Data Hub projektu var atrast OpenShift tÄ«mekļa konsolÄ, kopienas operatoru sadaļÄ. TÄdÄjÄdi OpenShift administrators var norÄdÄ«t, ka atbilstoÅ”ie OpenShift projekti tiek klasificÄti kÄ "Open Data Hub projekts". Tas tiek darÄ«ts vienu reizi. PÄc tam datu analÄ«tiÄ·is piesakÄs savÄ projektu telpÄ, izmantojot OpenShift tÄ«mekļa konsoli, un redz, ka ir instalÄts un pieejams viÅa projektiem atbilstoÅ”ais Kubernetes operators. PÄc tam viÅÅ” ar vienu klikŔķi izveido Open Data Hub projekta instanci un nekavÄjoties var piekļūt iepriekÅ” aprakstÄ«tajiem rÄ«kiem. Un to visu var konfigurÄt augstas pieejamÄ«bas un kļūdu tolerances režīmÄ.
Ja vÄlaties pats izmÄÄ£inÄt Open Data Hub projektu, sÄciet ar
RezumÄjot: Nopietnas mÄrogoÅ”anas problÄmas neļauj organizÄcijÄm pilnÄ«bÄ izmantot mÄkslÄ«gÄ intelekta un maŔīnmÄcÄ«Å”anÄs potenciÄlu. Red Hat OpenShift jau sen ir veiksmÄ«gi izmantots lÄ«dzÄ«gu problÄmu risinÄÅ”anai programmatÅ«ras industrijÄ. Open Data Hub projekts, kas Ä«stenots atvÄrtÄ pirmkoda izstrÄdes kopienÄ, piedÄvÄ atsauces arhitektÅ«ru pilna AI/ML darbÄ«bu cikla organizÄÅ”anai, pamatojoties uz OpenShift hibrÄ«da mÄkoni. Mums ir skaidrs un pÄrdomÄts Ŕī projekta attÄ«stÄ«bas plÄns, un mÄs nopietni domÄjam par aktÄ«vas un auglÄ«gas kopienas izveidi ap to, lai izstrÄdÄtu atvÄrtus AI risinÄjumus OpenShift platformÄ.
Avots: www.habr.com