InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu

Autor: Sergey Lukyanchikov, inženjer konzultant u InterSystems

AI/ML računalni pozivi u stvarnom vremenu

Započnimo s primjerima iz iskustva prakse Data Science u InterSystems:

  • Napunjeni portal za kupce povezan je s online sustavom preporuka. Doći će do restrukturiranja promocija u maloprodajnoj mreži (na primjer, umjesto "ravne" linije promocija sada će se koristiti matrica "segment-taktika"). Što se događa s motorima za preporuke? Što se događa s predajom i ažuriranjem podataka u mehanizam za preporuke (volumen ulaznih podataka se povećao za 25000 puta)? Što se događa s razvojem preporuka (potreba za smanjenjem praga filtriranja pravila preporuke za tisuću puta zbog tisućustrukog povećanja njihovog broja i "raspona")?
  • Postoji sustav za praćenje vjerojatnosti razvoja kvarova u komponentama opreme. Na sustav nadzora povezan je automatizirani sustav upravljanja procesima koji svake sekunde odašilje tisuće parametara tehnološkog procesa. Što se događa sa sustavom praćenja koji je prethodno radio na "ručnim uzorcima" (je li sposoban osigurati praćenje vjerojatnosti sekundu po sekundu)? Što će se dogoditi ako se u ulaznim podacima pojavi novi blok od nekoliko stotina stupaca s očitanjima sa senzora koji su nedavno dodani u sustav upravljanja procesom (hoće li biti potrebno i na koliko dugo zaustaviti nadzorni sustav da bi se podaci s novih senzora uključili u analizu) )?
  • Stvoren je skup AI/ML mehanizama (preporuka, praćenje, predviđanje) koji koriste rezultate međusobnog rada. Koliko je mjesečno potrebno radnih sati da se rad ovog kompleksa prilagodi promjenama ulaznih podataka? Što je opće "usporavanje" kada ga podupire upravljački kompleks za donošenje odluka (učestalost pojavljivanja novih popratnih informacija u njemu u odnosu na učestalost pojavljivanja novih ulaznih podataka)?

Sažimajući ove i mnoge druge primjere, došli smo do formulacije izazova koji se javljaju pri prelasku na korištenje mehanizama strojnog učenja i umjetne inteligencije u stvarnom vremenu:

  • Jesmo li zadovoljni brzinom stvaranja i prilagodbe (promjenjivoj situaciji) AI/ML razvoja u našoj tvrtki?
  • Koliko AI/ML rješenja koja koristimo podržavaju upravljanje poslovanjem u stvarnom vremenu?
  • Mogu li se AI/ML rješenja koja koristimo samostalno (bez programera) prilagoditi promjenama u praksi upravljanja podacima i poslovanjem?

Naš članak temeljit je pregled mogućnosti platforme InterSystems IRIS u smislu univerzalne podrške za implementaciju AI/ML mehanizama, sastavljanje (integraciju) AI/ML rješenja i obuku (testiranje) AI/ML rješenja na intenzivnim tokovi podataka. U ovom ćemo članku pogledati istraživanje tržišta, studije slučaja AI/ML rješenja i konceptualne aspekte onoga što nazivamo AI/ML platformom u stvarnom vremenu.

Ono što znamo iz anketa: aplikacije u stvarnom vremenu

Nalazi pregledkoje je među gotovo 800 IT stručnjaka 2019. proveo Lightbend, govore sami za sebe:

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 1. Vodeći potrošači podataka u stvarnom vremenu

Citirajmo bitne dijelove izvješća o rezultatima ove ankete u našem prijevodu:

“... Trendovi u popularnosti alata za integraciju tokova podataka i, u isto vrijeme, podrška računalstvu u spremnicima daju sinergijski odgovor na zahtjev tržišta za osjetljivijim, racionalnijim, dinamičnijim prijedlogom učinkovitih rješenja. Strujanje podataka prenosi informacije brže od tradicionalnih paketnih podataka. Tome je dodana mogućnost brze primjene računalnih metoda, kao što su, na primjer, preporuke temeljene na umjetnoj inteligenciji/ML-u, stvarajući konkurentske prednosti kroz povećano zadovoljstvo korisnika. Utrka za agilnošću također utječe na sve uloge u paradigmi DevOps - čineći razvoj i implementaciju aplikacija učinkovitijima. … Osam stotina i četiri IT stručnjaka dalo je informacije o korištenju protoka podataka u njihovim organizacijama. Ispitanici su uglavnom bili smješteni u zapadnim zemljama (41% u Europi i 37% u Sjevernoj Americi) i bili su gotovo ravnomjerno raspoređeni između malih, srednjih i velikih tvrtki. ...

... Umjetna inteligencija nije hype. Pedeset osam posto onih koji već koriste obradu toka podataka u produktivnim AI/ML aplikacijama potvrđuje da će njihova upotreba AI/ML zabilježiti najveći rast u sljedećoj godini (u usporedbi s drugim aplikacijama).

  • Prema većini ispitanika, korištenje tokova podataka u AI/ML scenarijima doživjet će najveći rast u sljedećoj godini.
  • Primjene u AI/ML-u će rasti ne samo zbog relativno novih vrsta scenarija, već i zbog tradicionalnih scenarija u kojima se sve više koriste podaci u stvarnom vremenu.
  • Osim AI/ML-a, razina entuzijazma među korisnicima IoT podatkovnih cjevovoda je impresivna - 48% onih koji su već integrirali IoT podatke kaže da će implementacija scenarija na tim podacima doživjeti značajan porast u bliskoj budućnosti. ..."

Iz ove prilično zanimljive ankete jasno je da je percepcija scenarija strojnog učenja i umjetne inteligencije kao vodećih u potrošnji podatkovnih tokova već "na putu". Ali jednako važno opažanje je percepcija AI/ML-a u stvarnom vremenu kroz leću DevOps-a: ovdje već možemo početi govoriti o transformaciji još uvijek dominantne kulture "AI/ML-a za jednokratnu upotrebu s potpuno dostupnim skupom podataka."

Koncept AI/ML platforme u stvarnom vremenu

Jedno tipično područje primjene za AI/ML u stvarnom vremenu je kontrola procesa u proizvodnji. Koristeći njezin primjer i uzimajući u obzir prethodne misli, formulirat ćemo koncept AI/ML platforme u stvarnom vremenu.
Korištenje umjetne inteligencije i strojnog učenja u upravljanju procesima ima niz značajki:

  • Podaci o stanju tehnološkog procesa primaju se intenzivno: visokom frekvencijom i za širok raspon parametara (i do desetak tisuća vrijednosti parametara koji se prenose u sekundi iz sustava upravljanja procesom)
  • Podaci o identifikaciji defekata, a da ne govorimo o njihovom razvoju, naprotiv, oskudni su i neredoviti, karakterizira ih nedovoljna tipizacija defekata i njihova lokalizacija u vremenu (često predstavljena papirnatim zapisima)
  • S praktičnog stajališta, za obuku i primjenu modela dostupan je samo "prozor relevantnosti" izvornih podataka, koji odražava dinamiku tehnološkog procesa tijekom razumnog kliznog intervala koji završava posljednjim očitanim vrijednostima parametara procesa.

Ove značajke tjeraju nas da, uz primanje i osnovnu obradu u stvarnom vremenu intenzivnog “širokopojasnog ulaznog signala” iz tehnološkog procesa, vršimo (paralelno) primjenu, obuku i kontrolu kvalitete rezultata AI ​​/ ML modeli - također u stvarnom vremenu. „Okvir“ koji naši modeli „vide“ u kliznom prozoru relevantnosti neprestano se mijenja – a s njim se mijenja i kvaliteta rezultata rada AI/ML modela treniranih na jednom od „okvira“ u prošlosti . Ukoliko dođe do pogoršanja kvalitete rezultata rada AI/ML modela (primjerice: vrijednost pogreške klasifikacije “alarm-norma” je izašla iz granica koje smo definirali), potrebno je automatski pokrenuti dodatnu obuku modela na aktualniji „okvir“ - a odabir trenutka za pokretanje dodatne obuke modela treba uzeti u obzir kako trajanje same obuke, tako i dinamiku pogoršanja kvalitete rada trenutne verzije modela (budući da trenutne verzije modela nastavljaju se koristiti dok se modeli treniraju, i dok se ne formiraju njihove "novo obučene" verzije).

InterSystems IRIS ima ključne mogućnosti platforme za omogućavanje AI/ML rješenja za kontrolu procesa u stvarnom vremenu. Te se sposobnosti mogu podijeliti u tri glavne skupine:

  • Kontinuirana implementacija (Continuous Deployment/Delivery, CD) novih ili prilagođenih postojećih AI/ML mehanizama u produktivno rješenje koje radi u stvarnom vremenu na InterSystems IRIS platformi
  • Kontinuirana integracija (CI) u jedinstveno produktivno rješenje dolaznih tokova podataka tehnološkog procesa, redova podataka za primjenu/obuku/kontrolu kvalitete AI/ML mehanizama i razmjene podataka/koda/kontrolnih radnji s okruženjima matematičkog modeliranja, orkestriranim u stvarnom vremenu platforma InterSystems IRIS
  • Kontinuirano (samo)obučavanje (Continuous Training, CT) AI/ML mehanizama, koje se izvodi u okruženjima matematičkog modeliranja korištenjem podataka, koda i kontrolnih radnji ("donesenih odluka") koje prenosi InterSystems IRIS platforma

Svrstavanje platformskih mogućnosti u odnosu na strojno učenje i umjetnu inteligenciju u upravo te skupine nije slučajno. Citirajmo metodološki objavljivanje Google, koji daje konceptualnu osnovu za ovu klasifikaciju, u našem prijevodu:

“... Koncept DevOps, popularan ovih dana, pokriva razvoj i rad velikih informacijskih sustava. Prednosti implementacije ovog koncepta su smanjenje trajanja razvojnih ciklusa, brža implementacija razvoja i fleksibilnost u planiranju izdanja. Kako bi se postigle te prednosti, DevOps uključuje implementaciju najmanje dvije prakse:

  • Kontinuirana integracija (CI)
  • Kontinuirana isporuka (CD)

Ove se prakse također primjenjuju na AI/ML platforme kako bi se osigurala pouzdana i učinkovita montaža produktivnih AI/ML rješenja.

AI/ML platforme razlikuju se od ostalih informacijskih sustava u sljedećim aspektima:

  • Kompetencije tima: Prilikom izrade AI/ML rješenja, tim obično uključuje podatkovne znanstvenike ili "akademske" stručnjake u području istraživanja podataka koji provode analizu podataka, razvijaju i testiraju modele. Ovi članovi tima možda nisu profesionalni programeri produktivnog koda.
  • Razvoj: AI/ML motori su eksperimentalne prirode. Kako bi se problem riješio na najučinkovitiji način, potrebno je proći kroz različite kombinacije ulaznih varijabli, algoritama, metoda modeliranja i parametara modela. Složenost takve pretrage leži u praćenju "što je funkcioniralo/nije radilo", osiguravanju ponovljivosti epizoda, generalizaciji razvoja za ponovljene implementacije.
  • Testiranje: Testiranje AI/ML motora zahtijeva širi raspon testova od većine drugih razvoja. Osim standardnih jediničnih i integracijskih testova, testira se valjanost podataka i kvaliteta rezultata primjene modela na uzorcima za obuku i kontroli.
  • Implementacija: Implementacija AI/ML rješenja nije ograničena na prediktivne usluge koje koriste jednom obučeni model. AI/ML rješenja izgrađena su oko višefaznih cjevovoda koji provode automatiziranu obuku modela i primjenu. Uvođenje takvih cjevovoda uključuje automatiziranje netrivijalnih radnji koje znanstvenici koji se bave podacima tradicionalno izvode ručno kako bi mogli trenirati i testirati modele.
  • Produktivnost: AI/ML motorima može nedostajati produktivnost ne samo zbog neučinkovitog programiranja, već i zbog stalno mijenjajuće prirode ulaznih podataka. Drugim riječima, izvedba AI/ML mehanizama može degradirati zbog šireg raspona razloga nego izvedba konvencionalnih razvoja. Što dovodi do potrebe za praćenjem (online) performansi naših AI/ML motora, kao i slanjem upozorenja ili odbijanjem rezultata ako pokazatelji performansi ne ispunjavaju očekivanja.

AI/ML platforme slične su drugim informacijskim sustavima po tome što oba zahtijevaju kontinuiranu integraciju koda s kontrolom verzija, jediničnim testiranjem, integracijskim testiranjem i kontinuiranim razvojem. Međutim, u slučaju AI/ML postoji nekoliko važnih razlika:

  • CI (Continuous Integration) više nije ograničen na testiranje i provjeru valjanosti koda postavljenih komponenti – također uključuje testiranje i provjeru valjanosti podataka i AI/ML modela.
  • CD (Continuous Delivery/Deployment, kontinuirana implementacija) nije ograničen na pisanje i puštanje paketa ili usluga, već podrazumijeva platformu za sastavljanje, obuku i primjenu AI/ML rješenja.
  • CT (Continuous Training, kontinuirana obuka) je novi element [cca. autor članka: novi element u odnosu na tradicionalni koncept DevOps, u kojem je CT, u pravilu, Continuous Testing], svojstven AI/ML platformama, odgovoran za autonomno upravljanje mehanizmima za obuku i primjenu AI /ML modeli. ..."

Možemo ustvrditi da strojno učenje i umjetna inteligencija koji rade na podacima u stvarnom vremenu zahtijevaju širi skup alata i kompetencija (od razvoja koda do orkestracije okruženja za matematičko modeliranje), bližu integraciju između svih funkcionalnih i predmetnih područja, učinkovitiju organizaciju ljudskih i resursi stroja.

Scenarij u stvarnom vremenu: prepoznavanje razvoja kvarova u napojnim pumpama

Nastavljajući koristiti područje upravljanja procesom kao primjer, razmotrite specifičan problem (već smo spomenuli na samom početku): moramo osigurati praćenje razvoja grešaka u crpkama u stvarnom vremenu na temelju protoka vrijednosti parametara procesa ​​i izvješća osoblja za popravke o identificiranim kvarovima.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 2. Formulacija problema za praćenje razvoja nedostataka

Značajka većine zadataka koji se na ovaj način postavljaju u praksi je da se pravilnost i učinkovitost prijema podataka (APCS) moraju razmatrati u kontekstu epizodičnog i neredovitog pojavljivanja (i registriranja) grešaka različitih vrsta. Drugim riječima: podaci iz sustava kontrole procesa stižu jednom u sekundi, ispravni i točni, a nedostaci se bilježe kemijskom olovkom s datumom u općoj bilježnici u radionici (primjerice: „12.01 – curenje u poklopac sa strane 3. ležaj”).

Dakle, formulaciju problema možemo nadopuniti sljedećim važnim ograničenjem: imamo samo jednu "oznaku" greške određene vrste (tj. primjer greške određene vrste predstavljen je podacima iz kontrole procesa sustava na određeni datum - i nemamo više primjera kvara ove vrste). Ovo ograničenje odmah nas vodi izvan okvira klasičnog strojnog učenja (nadziranog učenja), za koje bi trebalo postojati puno “tagova”.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 3 Pojašnjenje zadatka praćenja razvoja nedostataka

Možemo li nekako “umnožiti” jedinu “oznaku” koja nam je na raspolaganju? Da mi možemo. Trenutno stanje crpke karakterizira stupanj sličnosti registriranim nedostacima. Čak i bez korištenja kvantitativnih metoda, na razini vizualne percepcije, promatranjem dinamike vrijednosti podataka koji pristižu iz sustava upravljanja procesima, već se može puno naučiti:

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 4. Dinamika stanja crpke na pozadini "oznake" kvara određene vrste

Ali vizualna percepcija (barem za sada) nije najprikladniji generator "oznaka" u našem scenariju koji se brzo mijenja. Pomoću statističkog testa procijenit ćemo sličnost trenutnog stanja pumpe s prijavljenim nedostacima.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 5 Primjena statističkog testa na dolazne podatke u pozadini "oznake" greške

Statističkim testom utvrđuje se vjerojatnost da su zapisi s vrijednostima parametara tehnološkog procesa u „flow-paketu“ primljenom od sustava upravljanja procesom slični zapisima „tag“ greške određene vrste. Vrijednost vjerojatnosti (statistički indeks sličnosti) izračunata kao rezultat primjene statističkog testa pretvara se u vrijednost 0 ili 1, postajući "oznaka" za strojno učenje u svakom određenom zapisu u paketu koji se ispituje na sličnost. Odnosno, nakon obrade novoprimljenog paketa zapisa stanja pumpe sa statističkim testom, imamo priliku (a) dodati ovaj paket skupu za obuku za obuku AI/ML modela i (b) izvršiti kontrolu kvalitete trenutna verzija modela kada se koristi u ovom paketu.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 6 Primjena modela strojnog učenja na dolazne podatke u pozadini "oznake" greške

U jednom od naših prethodnih webinari Pokazujemo i objašnjavamo kako InterSystems IRIS platforma omogućuje implementaciju bilo kojeg AI/ML mehanizma u obliku kontinuiranog izvršavanja poslovnih procesa koji prate pouzdanost rezultata modeliranja i prilagođavaju parametre modela. Prilikom implementacije prototipa našeg scenarija s pumpama, koristimo sve InterSystems IRIS funkcionalnosti predstavljene tijekom webinara - implementirajući u proces analizatora kao dio našeg rješenja ne klasično nadzirano učenje, već učenje s pojačanjem, koje automatski upravlja odabirom za modele obuke . Uzorak za obuku sadrži zapise na kojima se javlja "konsenzus o otkrivanju" nakon primjene statističkog testa i trenutne verzije modela - tj. i statistički test (nakon transformacije indeksa sličnosti na 0 ili 1) i model dali su rezultat na takvim zapisima 1. Tijekom novog uvježbavanja modela, tijekom njegove validacije (novouvježbani model se primjenjuje na vlastiti uzorak uvježbavanja, uz preliminarnu primjenu statističkog testa na njemu), bilježi da „nije zadržao” rezultat 1 nakon obrade. statističkim testom (zbog stalne prisutnosti u obuci uzorka zapisa s izvorne „oznake“ greške), uklanjaju se iz skupa za obuku, a nova verzija modela uči iz „oznake“ kvar plus "zadržani" zapisi iz toka.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 7 Robotizacija AI/ML računarstva u InterSystems IRIS

Ako postoji potreba za nekom vrstom "drugog mišljenja" o kvaliteti detekcije dobivenoj tijekom lokalnih izračuna u InterSystems IRIS-u, kreira se proces savjetnika za izvođenje obuke i primjene modela na skupu kontrolnih podataka pomoću usluga u oblaku (na primjer, Microsoft Azure, Amazon Web Services, Google Cloud Platform itd.):

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 8. Drugo mišljenje iz Microsoft Azurea koje je orkestrirao InterSystems IRIS

Prototip našeg scenarija u InterSystems IRIS dizajniran je kao sustav analitičkih procesa temeljen na agentima koji su u interakciji s objektom opreme (pumpa), okruženjima matematičkog modeliranja (Python, R i Julia) i osiguravaju samoučenje svih uključenih AI/ ML mehanizmi - na tokovima podataka u stvarnom vremenu .

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 9. Glavna funkcionalnost AI/ML rješenja u stvarnom vremenu u InterSystems IRIS

Praktični rezultat našeg prototipa:

  • Defekt uzorka koji je prepoznao model (12. siječnja):

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu

  • Kvar u razvoju koji je prepoznao model koji nije bio uključen u uzorak (11. rujna, sam kvar identificirao je tim za popravak tek dva dana kasnije, 13. rujna):

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Simulacija na stvarnim podacima koji sadrže nekoliko epizoda istog kvara pokazala je da nam naše rješenje, implementirano na InterSystems IRIS platformi, omogućuje prepoznavanje razvoja kvarova ovog tipa nekoliko dana prije nego što ih otkrije tim za popravke.

InterSystems IRIS - univerzalna AI/ML računalna platforma u stvarnom vremenu

InterSystems IRIS platforma pojednostavljuje razvoj, implementaciju i rad podatkovnih rješenja u stvarnom vremenu. InterSystems IRIS sposoban je istovremeno obavljati transakcijsku i analitičku obradu podataka; podržavati sinkronizirane prikaze podataka prema više modela (uključujući relacijske, hijerarhijske, objektne i dokumentne); djelovati kao platforma za integraciju širokog spektra izvora podataka i pojedinačnih aplikacija; pružaju naprednu analitiku strukturiranih i nestrukturiranih podataka u stvarnom vremenu. InterSystems IRIS također nudi mehanizme za korištenje vanjskih analitičkih alata i omogućuje fleksibilnu kombinaciju hostinga u oblaku i na lokalnim poslužiteljima.

Aplikacije izgrađene na platformi InterSystems IRIS raspoređene su u različitim industrijama, pomažući tvrtkama da ostvare značajne ekonomske koristi iz strateške i operativne perspektive, povećavajući informirano donošenje odluka i premošćivajući jaz između događaja, analize i akcije.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 10 InterSystems IRIS arhitektura u kontekstu AI/ML-a u stvarnom vremenu

Kao i prethodni dijagram, dijagram u nastavku kombinira novi “koordinatni sustav” (CD/CI/CT) s dijagramom protoka informacija između radnih elemenata platforme. Vizualizacija počinje s makromehanizmom CD i nastavlja se s makromehanizmom CI i CT.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 11 Dijagram protoka informacija između AI/ML elemenata platforme InterSystems IRIS

Bit CD mehanizma u InterSystems IRIS: korisnici platforme (programeri AI/ML rješenja) prilagođavaju postojeće i/ili stvaraju nove AI/ML razvoje koristeći specijalizirani uređivač koda za AI/ML mehanizme: Jupyter (puno ime: Jupyter Notebook; radi sažetosti, dokumenti stvoreni u ovom uređivaču također se ponekad nazivaju). U Jupyteru, razvojni programer ima priliku pisati, ispravljati pogreške i verificirati izvedbu (uključujući korištenje grafike) određenog AI/ML razvoja prije nego što se on postavi ("postavi") u InterSystems IRIS. Jasno je da će novi razvoj kreiran na ovaj način dobiti samo osnovno uklanjanje pogrešaka (budući da Jupyter posebno ne radi s tokovima podataka u stvarnom vremenu) - to je u redu stvari, jer je glavni rezultat razvoja u Jupyteru je potvrda temeljne operativnosti zasebnog AI/ML mehanizma (“pokazuje očekivani rezultat na uzorku podataka”). Slično tome, mehanizam koji je već postavljen na platformu (pogledajte sljedeće makro-mehanizme) prije otklanjanja pogrešaka u Jupyteru može zahtijevati "povratak" na obrazac "pre platforme" (čitanje podataka iz datoteka, rad s podacima putem xDBC-a umjesto tablica, izravna interakcija s globalima - višedimenzionalni nizovi podataka InterSystems IRIS – itd.).

Važan aspekt implementacije CD-a u InterSystems IRIS: implementirana je dvosmjerna integracija između platforme i Jupytera, što omogućuje prijenos sadržaja u Python, R i Julia na platformu (i, naknadno, obradu u platformi) (sva tri su programska jezika u odgovarajućim vodećim jezicima otvorenog koda).izvorna okruženja za matematičko modeliranje). Stoga programeri AI/ML sadržaja imaju priliku provoditi "kontinuiranu implementaciju" ovog sadržaja na platformi, radeći u svom poznatom uređivaču Jupyter, s poznatim bibliotekama dostupnim u Python, R, Julia, i obavljajući osnovno uklanjanje pogrešaka (ako je potrebno) izvan platforme.

Prijeđimo na CI makro mehanizam u InterSystems IRIS. Dijagram prikazuje makro proces "robotizatora u stvarnom vremenu" (kompleks struktura podataka, poslovnih procesa i fragmenata koda koje oni orkestriraju u matematičkim jezicima i ObjectScript - izvornom razvojnom jeziku InterSystems IRIS). Zadatak ovog makro procesa je održavati redove podataka potrebnih za rad AI/ML mehanizama (na temelju tokova podataka koji se prenose na platformu u stvarnom vremenu), donositi odluke o redoslijedu primjene i "asortimanu" AI/ML-a. ML mehanizmi (oni su i “matematički algoritmi”, “modeli” itd. – mogu se različito zvati ovisno o specifičnostima implementacije i terminološkim preferencijama), održavaju strukture podataka ažurnima za analizu rezultata rada AI/ ML mehanizmi (kocke, tablice, višedimenzionalni nizovi podataka itd.) itd. – za izvješća, nadzorne ploče itd.).

Važan aspekt implementacije CI-ja u InterSystems IRIS: implementirana je dvosmjerna integracija između platforme i okruženja za matematičko modeliranje, što vam omogućuje izvršavanje sadržaja hostiranog na platformi u Pythonu, R i Juliji u njihovim odgovarajućim okruženjima i primanje rezultata izvršenja. Ova integracija implementirana je u "terminalnom načinu" (tj. AI/ML sadržaj formuliran je kao ObjectScript kod koji upućuje pozive okolini) i u "poslovnom procesu" (tj. AI/ML sadržaj je formuliran kao poslovni proces korištenjem grafičkog editora, ili ponekad korištenjem Jupytera, ili korištenjem IDE-a - IRIS Studio, Eclipse, Visual Studio Code). Dostupnost poslovnih procesa za uređivanje u Jupyteru ogleda se kroz povezanost IRIS-a na CI razini i Jupytera na CD razini. Detaljniji pregled integracije s okruženjima za matematičko modeliranje dan je u nastavku. U ovoj fazi, po našem mišljenju, postoje svi razlozi da se osigura da platforma ima sve potrebne alate za implementaciju "kontinuirane integracije" AI/ML razvoja (koji dolazi iz "kontinuirane implementacije") u AI/ML rješenja u stvarnom vremenu.

I glavni makro mehanizam: CT. Bez njega neće biti AI/ML platforme (iako će se “stvarno vrijeme” implementirati kroz CD/CI). Bit CT-a je rad platforme s "artefaktima" strojnog učenja i umjetne inteligencije izravno u radnim sesijama okruženja matematičkog modeliranja: modeli, distribucijske tablice, matrični vektori, slojevi neuronskih mreža itd. Taj se “rad” u većini slučajeva sastoji od stvaranja spomenutih artefakata u okruženjima (u slučaju modela, na primjer, “kreiranje” se sastoji od postavljanja specifikacije modela i naknadnog odabira vrijednosti njegovih parametara - tzv. “trening” modela), njihova primjena (za modele: izračun uz njihovu pomoć “modelskih” vrijednosti ciljnih varijabli - prognoze, pripadnost kategoriji, vjerojatnost događaja itd.) i poboljšanje već kreirani i primijenjeni artefakti (primjerice, redefiniranje skupa ulaznih varijabli modela na temelju rezultata primjene - u cilju poboljšanja točnosti predviđanja, kao opcija). Ključna točka u razumijevanju uloge CT-a je njegova "apstrakcija" od stvarnosti CD-a i CI-ja: CT će implementirati sve artefakte, fokusirajući se na računalne i matematičke specifičnosti AI/ML rješenja unutar mogućnosti koje pružaju određena okruženja. Odgovornost za „pružanje inputa“ i „isporuku rezultata“ bit će odgovornost CD-a i CI-ja.

Važan aspekt implementacije CT-a posebno u InterSystems IRIS: koristeći već gore spomenutu integraciju s okolinama za matematičko modeliranje, platforma ima mogućnost izdvojiti upravo te artefakte iz radnih sesija koje se odvijaju pod njezinom kontrolom u matematičkim okolinama i (što je najvažnije) okrenuti u podatkovne objekte platforme. Na primjer, distribucijska tablica koja je upravo stvorena u radnoj Python sesiji može se (bez zaustavljanja Python sesije) prenijeti na platformu u obliku, na primjer, globalne (višedimenzionalnog InterSystems IRIS polja podataka) - i koristiti za izračune u drugom AI/ML-mehanizmu (implementiranom u jeziku drugog okruženja - na primjer, u R) - ili virtualnoj tablici. Drugi primjer: paralelno s "normalnim načinom" rada modela (u radnoj sesiji Pythona), na njegovim ulaznim podacima provodi se "auto-ML": automatski odabir optimalnih ulaznih varijabli i vrijednosti parametara. A zajedno s "redovnim" treningom, produktivan model u stvarnom vremenu dobiva i "prijedlog za optimizaciju" svoje specifikacije - u kojem se mijenja skup ulaznih varijabli, mijenjaju se vrijednosti parametara (više ne kao rezultat treninga u Pythonu, ali kao rezultat obuke sa samom "alternativnom" verzijom, kao što je H2O stack), omogućujući ukupnom AI/ML rješenju da se samostalno nosi s neočekivanim promjenama u prirodi ulaznih podataka i fenomena koji se modeliraju .

Upoznajmo se detaljnije s funkcionalnošću platforme AI/ML InterSystems IRIS, koristeći primjer prototipa iz stvarnog života.

U donjem dijagramu, na lijevoj strani slajda nalazi se dio poslovnog procesa koji implementira izvršavanje skripti u Pythonu i R. U središnjem dijelu nalaze se vizualni dnevnici izvršavanja nekih od tih skripti, odnosno u Pythonu i R. Odmah iza njih su primjeri sadržaja na jednom i drugom jeziku, preneseni na izvođenje u odgovarajuća okruženja. Na kraju s desne strane su vizualizacije temeljene na rezultatima izvršavanja skripte. Vizualizacije na vrhu napravljene su na IRIS Analytics (podaci su preuzeti iz Pythona u podatkovnu platformu InterSystems IRIS i prikazane na nadzornoj ploči pomoću platforme), na dnu su napravljene izravno u radnoj sesiji R i izlaz odatle u grafičke datoteke . Važan aspekt: ​​predstavljeni fragment u prototipu odgovoran je za obuku modela (klasifikacija stanja opreme) na podacima primljenim u stvarnom vremenu iz procesa simulatora opreme, prema naredbi iz procesa praćenja kvalitete klasifikacije promatranog tijekom primjene modela. O implementaciji AI/ML rješenja u obliku skupa međusobno povezanih procesa ("agenta") raspravljat ćemo dalje.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 12 Interakcija s Python, R i Julia u InterSystems IRIS

Platformski procesi (oni su i “poslovni procesi”, “analitički procesi”, “cjevovodi” itd. - ovisno o kontekstu), prije svega se uređuju u grafičkom uređivaču poslovnih procesa u samoj platformi, i to u takvom način da se i njegov blok dijagram i odgovarajući AI/ML mehanizam (programski kod) kreiraju istovremeno. Kada kažemo da je "dobiven AI/ML mehanizam", u početku mislimo na hibridnost (unutar jednog procesa): sadržaj u jezicima okruženja za matematičko modeliranje susjedan je sadržaju u SQL-u (uključujući proširenja iz Integrirani ML), u InterSystems ObjectScript, s drugim podržanim jezicima. Štoviše, proces platforme pruža vrlo široke mogućnosti za "renderiranje" u obliku hijerarhijski ugniježđenih fragmenata (kao što se može vidjeti u primjeru na donjem dijagramu), što vam omogućuje da učinkovito organizirate čak i vrlo složen sadržaj bez da ikada "ispadnete" grafičkog formata (u “negrafičke” formate). » metode/klase/procedure itd.). Odnosno, ako je potrebno (a to je predviđeno u većini projekata), apsolutno cijelo AI/ML rješenje može se implementirati u grafički samodokumentirajući format. Napominjemo da je u središnjem dijelu donjeg dijagrama, koji predstavlja višu “razinu ugniježđenja”, jasno vidljivo da se uz sam rad na obučavanju modela (koristeći Python i R) provodi analiza tzv. Dodana je ROC krivulja treniranog modela, što omogućuje vizualnu (i računalno) procjenu kvalitete obuke - a ova analiza je implementirana u jeziku Julia (izvršava se, prema tome, u matematičkom okruženju Julia).

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 13 Vizualno okruženje za sastav AI/ML rješenja u InterSystems IRIS

Kao što je ranije spomenuto, inicijalni razvoj i (u nekim slučajevima) prilagodba AI/ML mehanizama koji su već implementirani u platformu će se/moći obaviti izvan platforme u uređivaču Jupyter. Na donjem dijagramu vidimo primjer prilagođavanja postojećeg platformskog procesa (isti kao na gornjem dijagramu) - ovako izgleda fragment koji je odgovoran za treniranje modela u Jupyteru. Python sadržaj dostupan je za uređivanje, otklanjanje pogrešaka i grafički izlaz izravno u Jupyteru. Promjene (ako su potrebne) mogu se izvršiti trenutnom sinkronizacijom u procesu platforme, uključujući njegovu produktivnu verziju. Novi sadržaj se može prenijeti na platformu na sličan način (automatski se generira novi proces platforme).

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 14 Korištenje Jupyter Notebooka za uređivanje AI/ML mehanizma u InterSystems IRIS platformi

Prilagodba procesa platforme može se izvesti ne samo u grafičkom ili prijenosnom formatu - već iu "totalnom" IDE (Integrated Development Environment) formatu. Ovi IDE-ovi su IRIS Studio (nativni IRIS studio), Visual Studio Code (InterSystems IRIS proširenje za VSCode) i Eclipse (Atelier dodatak). U nekim slučajevima moguće je da razvojni tim koristi sva tri IDE-a istovremeno. Donji dijagram prikazuje primjer uređivanja istog procesa u IRIS studiju, Visual Studio Code i Eclipse. Apsolutno svi sadržaji dostupni su za uređivanje: Python/R/Julia/SQL, ObjectScript i poslovni procesi.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 15 Razvoj poslovnog procesa InterSystems IRIS u različitim IDE-ima

Alati za opisivanje i izvršavanje poslovnih procesa InterSystems IRIS u Business Process Language (BPL) zaslužuju poseban spomen. BPL omogućuje korištenje “gotovih integracijskih komponenti” (aktivnosti) u poslovnim procesima – što, zapravo, daje sve razloge da se kaže da je “kontinuirana integracija” implementirana u InterSystems IRIS. Gotove komponente poslovnih procesa (aktivnosti i veze između njih) snažan su akcelerator za sastavljanje AI/ML rješenja. I ne samo sklopovi: zahvaljujući aktivnostima i vezama između njih preko različitih AI/ML razvoja i mehanizama, nastaje "autonomni upravljački sloj", sposoban donositi odluke u skladu sa situacijom, u stvarnom vremenu.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 16. Gotove komponente poslovnih procesa za kontinuiranu integraciju (CI) na InterSystems IRIS platformi

Koncept agentskih sustava (također poznat kao "višeagentski sustavi") ima jaku poziciju u robotizaciji, a InterSystems IRIS platforma ga organski podržava kroz konstrukciju "proizvod-proces". Uz neograničene mogućnosti za „punjenje“ svakog procesa funkcionalnošću potrebnom za cjelokupno rješenje, davanje sustava platformskih procesa svojstvom „agencije“ omogućuje stvaranje učinkovitih rješenja za izrazito nestabilne simulirane fenomene (ponašanje društvenih/ biosustavi, djelomično vidljivi tehnološki procesi itd.).

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 16 Rad AI/ML rješenja kao sustava poslovnih procesa temeljenog na agentima u InterSystems IRIS

Nastavljamo naš pregled InterSystems IRIS s pričom o primijenjenoj upotrebi platforme za rješavanje cijelih klasa problema u stvarnom vremenu (prilično detaljan uvod u neke od najboljih praksi platforme AI/ML na InterSystems IRIS možete pronaći u jednom našeg prethodnog webinari).

Za petama prethodnog dijagrama, ispod je detaljniji dijagram agentskog sustava. Dijagram prikazuje isti prototip, vidljiva su sva četiri agentska procesa, shematski su nacrtani odnosi između njih: GENERATOR - obrađuje stvaranje podataka pomoću senzora opreme, BUFFER - upravlja redovima čekanja podataka, ANALIZATOR - sam izvodi strojno učenje, MONITOR - nadzire kvalitetu strojnog učenja i daje signal o potrebi ponovne obuke modela.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 17 Sastav AI/ML rješenja u obliku sustava poslovnih procesa temeljenog na agentima u InterSystems IRIS

Donji dijagram ilustrira autonomno funkcioniranje drugog robotskog prototipa (prepoznavanje emocionalne obojenosti teksta) neko vrijeme. U gornjem dijelu je evolucija pokazatelja kvalitete obučavanja modela (kvaliteta raste), u donjem dijelu je dinamika pokazatelja kvalitete primjene modela i činjenice ponovljene obuke (crvene pruge). Kao što možete vidjeti, rješenje se naučilo učinkovito i autonomno te radi na zadanoj razini kvalitete (vrijednosti ocjene kvalitete ne padaju ispod 80%).

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 18 Kontinuirano (samo)obučavanje (CT) na platformi InterSystems IRIS

Također smo ranije spomenuli "auto-ML", ali dijagram u nastavku detaljno prikazuje korištenje ove funkcionalnosti na primjeru drugog prototipa. Grafički dijagram fragmenta poslovnog procesa prikazuje aktivnost koja pokreće modeliranje u H2O stogu, prikazuje rezultate ovog modeliranja (jasna dominacija rezultirajućeg modela nad modelima koje je napravio čovjek, prema usporednom dijagramu ROC krivulje, kao i automatizirana identifikacija "najutjecajnijih varijabli" dostupnih u izvornom skupu podataka). Ovdje je važna ušteda vremena i stručnih resursa koja se postiže kroz “auto-ML”: ono što proces naše platforme učini u pola minute (pronalaženje i obuka optimalnog modela) stručnjaku može trajati od tjedan do mjesec dana.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 19 Integracija "auto-ML" u AI/ML rješenje na platformi InterSystems IRIS

Donji dijagram malo promašuje bit, ali je dobar način da završimo priču o klasama problema u stvarnom vremenu koji se rješavaju: podsjećamo vas da uz sve mogućnosti InterSystems IRIS platforme, modeli za obuku pod njezinom kontrolom su nije obavezno. Platforma može primiti izvana takozvanu PMML specifikaciju modela, obučenu u alatu koji nije pod kontrolom platforme - i primijeniti ovaj model u stvarnom vremenu od trenutka kada je uvezen PMML specifikacije. Važno je uzeti u obzir da se svi AI/ML artefakti ne mogu svesti na PMML specifikaciju, čak i ako većina najčešćih artefakata to dopušta. Stoga je platforma InterSystems IRIS "otvorena petlja" i ne znači "ropstvo platforme" za korisnike.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 20 Integracija "auto-ML" u AI/ML rješenje na platformi InterSystems IRIS

Nabrojimo dodatne prednosti platforme InterSystems IRIS (radi jasnoće, u odnosu na kontrolu procesa), koje su od velike važnosti u automatizaciji umjetne inteligencije i strojnog učenja u stvarnom vremenu:

  • Razvijeni integracijski alati s bilo kojim izvorima podataka i potrošačima (sustav upravljanja procesima/SCADA, oprema, MRO, ERP, itd.)
  • Ugrađena višemodelni DBMS za visokoučinkovitu transakcijsku i analitičku obradu (Hybrid Transaction/Analytical Processing, HTAP) bilo koje količine podataka tehnološkog procesa
  • Razvojni alati za kontinuiranu implementaciju AI/ML motora za rješenja u stvarnom vremenu temeljena na Python, R, Julia
  • Prilagodljivi poslovni procesi za kontinuiranu integraciju i (samo)učenje pokretača AI/ML rješenja u stvarnom vremenu
  • Ugrađeni alati poslovne inteligencije za vizualizaciju procesnih podataka i rezultata AI/ML rješenja
  • Upravljanje API-jem za isporuku rezultata AI/ML rješenja sustavima upravljanja procesima/SCADA, informacijskim i analitičkim sustavima, slanje upozorenja itd.

AI/ML rješenja na InterSystems IRIS platformi lako se uklapaju u postojeću IT infrastrukturu. InterSystems IRIS platforma osigurava visoku pouzdanost AI/ML rješenja podržavajući konfiguracije otporne na greške i katastrofe te fleksibilnu implementaciju u virtualnim okruženjima, na fizičkim poslužiteljima, u privatnim i javnim oblacima i Docker spremnicima.

Stoga je InterSystems IRIS univerzalna AI/ML računalna platforma u stvarnom vremenu. Univerzalnost naše platforme potvrđena je u praksi nepostojanjem de facto ograničenja složenosti implementiranih izračuna, sposobnošću InterSystems IRIS-a da kombinira (u stvarnom vremenu) obradu scenarija iz širokog spektra industrija, te iznimnom prilagodljivošću sve funkcije i mehanizme platforme prema specifičnim potrebama korisnika.

InterSystems IRIS - univerzalna AI/ML platforma u stvarnom vremenu
Slika 21 InterSystems IRIS - univerzalna AI/ML računalna platforma u stvarnom vremenu

Za sadržajniju interakciju s onim našim čitateljima koji su zainteresirani za ovdje predstavljen materijal, preporučujemo da se ne ograničite na njegovo čitanje i nastavite dijalog "uživo". Rado ćemo pružiti podršku pri formuliranju AI/ML scenarija u stvarnom vremenu u odnosu na specifičnosti vaše tvrtke, izvesti zajedničku izradu prototipova na InterSystems IRIS platformi, formulirati i u praksi implementirati plan za uvođenje umjetne inteligencije i strojnog učenja u vaše procese proizvodnje i upravljanja. Kontaktna e-pošta našeg stručnog tima za umjetnu inteligenciju/ML – [e-pošta zaštićena].

Izvor: www.habr.com

Dodajte komentar