InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase

Autor: Sergey Lukyanchikov, konzultačný inžinier spoločnosti InterSystems

Výpočtové hovory AI/ML v reálnom čase

Začnime príkladmi zo skúseností z praxe Data Science v InterSystems:

  • Načítaný nákupný portál je prepojený s online systémom odporúčaní. Dôjde k reštrukturalizácii akcií v celej maloobchodnej sieti (napríklad namiesto „plochého“ radu akcií sa teraz použije matica „segment-taktiky“). Čo sa stane s nástrojmi odporúčaní? Čo sa stane s odosielaním a aktualizáciou údajov do odporúčacieho nástroja (objem vstupných údajov sa zvýšil 25000 XNUMX-krát)? Čo sa stane s vývojom odporúčaní (potreba tisícnásobne znížiť prah filtrovania pravidiel odporúčaní kvôli tisícnásobnému zvýšeniu ich počtu a „rozsahu“)?
  • Existuje systém na monitorovanie pravdepodobnosti výskytu chýb v komponentoch zariadenia. K monitorovaciemu systému bol pripojený automatizovaný systém riadenia procesov, ktorý každú sekundu prenáša tisíce technologických parametrov procesu. Čo sa stane s monitorovacím systémom, ktorý predtým pracoval na „manuálnych vzorkách“ (je schopný poskytovať monitorovanie sekundy po sekunde)? Čo sa stane, ak sa vo vstupných dátach objaví nový blok s niekoľkými stovkami stĺpcov s údajmi zo senzorov, ktoré boli nedávno pridané do systému riadenia procesov (bude potrebné a na ako dlho zastaviť monitorovací systém, aby boli do analýzy zahrnuté údaje z nových senzorov? )?
  • Bol vytvorený súbor mechanizmov AI/ML (odporúčanie, monitorovanie, prognózovanie), ktoré využívajú výsledky vzájomnej práce. Koľko človekohodín je potrebných každý mesiac na prispôsobenie prevádzky tohto komplexu zmenám vo vstupných údajoch? Aké je všeobecné „spomalenie“ pri podpore komplexu manažérskeho rozhodovania (frekvencia výskytu nových podporných informácií v ňom v pomere k frekvencii výskytu nových vstupných údajov)?

Zhrnutím týchto a mnohých ďalších príkladov sme dospeli k formulácii výziev, ktoré vznikajú pri prechode na používanie mechanizmov strojového učenia a umelej inteligencie v reálnom čase:

  • Sme spokojní s rýchlosťou vytvárania a prispôsobovania sa (meniacej sa situácii) vývoja AI/ML v našej spoločnosti?
  • Do akej miery podporujú riešenia AI/ML, ktoré používame, riadenie podniku v reálnom čase?
  • Sú riešenia AI/ML, ktoré používame, schopné sa nezávisle (bez vývojárov) prispôsobiť zmenám v postupoch riadenia údajov a podnikania?

Náš článok je dôkladným prehľadom možností platformy InterSystems IRIS z hľadiska univerzálnej podpory nasadzovania mechanizmov AI/ML, montáže (integrácie) riešení AI/ML a školenia (testovania) riešení AI/ML na intenzívnych dátové toky. V tomto článku sa pozrieme na prieskum trhu, prípadové štúdie riešení AI/ML a koncepčné aspekty toho, čo nazývame platforma AI/ML v reálnom čase.

Čo vieme z prieskumov: aplikácie v reálnom čase

výsledky prehľaduskutočnené medzi takmer 800 IT profesionálmi v roku 2019 spoločnosťou Lightbend, hovoria samy za seba:

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 1 Poprední spotrebitelia údajov v reálnom čase

Dovoľte nám citovať dôležité fragmenty správy o výsledkoch tohto prieskumu v našom preklade:

„... Trendy v obľúbenosti nástrojov na integráciu dátových tokov a zároveň podpory výpočtovej techniky v kontajneroch poskytujú synergickú odpoveď na požiadavku trhu po citlivejšom, racionálnejšom a dynamickejšom návrhu efektívnych riešení. Streamovanie dát prenáša informácie rýchlejšie ako tradičné paketové dáta. K tomu sa pridáva schopnosť rýchlo aplikovať výpočtové metódy, ako sú napríklad odporúčania založené na AI/ML, čím sa vytvárajú konkurenčné výhody prostredníctvom zvýšenej spokojnosti zákazníkov. Preteky o agilitu tiež ovplyvňujú všetky úlohy v paradigme DevOps – vďaka čomu je vývoj a nasadzovanie aplikácií efektívnejšie. … Osemstoštyri IT profesionálov poskytlo informácie o využívaní dátových tokov vo svojich organizáciách. Respondenti sa nachádzali prevažne v západných krajinách (41 % v Európe a 37 % v Severnej Amerike) a boli takmer rovnomerne rozdelení medzi malé, stredné a veľké spoločnosti. ...

... Umelá inteligencia nie je humbuk. Päťdesiatosem percent tých, ktorí už používajú spracovanie dátového toku v produktívnych aplikáciách AI/ML, potvrdzuje, že ich používanie AI/ML zaznamená v budúcom roku najväčší nárast (v porovnaní s inými aplikáciami).

  • Podľa väčšiny respondentov zaznamená v budúcom roku najväčší nárast využitie dátových tokov v scenároch AI/ML.
  • Aplikácie v AI/ML budú rásť nielen vďaka relatívne novým typom scenárov, ale aj vďaka tradičným scenárom, v ktorých sa čoraz viac využívajú dáta v reálnom čase.
  • Okrem AI/ML je úroveň nadšenia medzi používateľmi dátových kanálov internetu vecí pôsobivá – 48 % tých, ktorí už integrovali dáta IoT, tvrdí, že implementácia scenára na tieto dáta zaznamená v blízkej budúcnosti výrazný nárast. ..."

Z tohto pomerne zaujímavého prieskumu je zrejmé, že vnímanie scenárov strojového učenia a umelej inteligencie ako lídrov v spotrebe dátových tokov je už „na ceste“. Ale rovnako dôležitým postrehom je vnímanie AI/ML v reálnom čase cez optiku DevOps: tu už môžeme začať hovoriť o transformácii stále dominantnej kultúry „jednorázového AI/ML s plne dostupným súborom údajov“.

Koncept platformy AI/ML v reálnom čase

Jednou z typických oblastí použitia AI/ML v reálnom čase je riadenie procesov vo výrobe. Na jej príklade a s prihliadnutím na predchádzajúce myšlienky sformulujeme koncept platformy AI/ML v reálnom čase.
Použitie umelej inteligencie a strojového učenia pri riadení procesov má množstvo funkcií:

  • Údaje o stave technologického procesu sú prijímané intenzívne: s vysokou frekvenciou a pre široký rozsah parametrov (až desiatky tisíc hodnôt parametrov prenášaných za sekundu z riadiaceho systému procesu)
  • Údaje o identifikácii defektov, nehovoriac o údajoch o ich vývoji, sú naopak vzácne a nepravidelné, vyznačujúce sa nedostatočnou typizáciou defektov a ich lokalizáciou v čase (často reprezentované papierovými záznamami).
  • Z praktického hľadiska je pre trénovanie a aplikáciu modelov k dispozícii iba „okno relevantnosti“ zdrojových údajov, ktoré odráža dynamiku technologického procesu v primeranom kĺzavom intervale končiacom poslednými načítanými hodnotami procesných parametrov.

Tieto vlastnosti nás nútia okrem príjmu a základného spracovania v reálnom čase intenzívneho „širokopásmového vstupného signálu“ z technologického procesu vykonávať (paralelne) aplikáciu, školenie a kontrolu kvality výsledkov AI ​​/ ML modely – aj v reálnom čase. „Rám“, ktorý naše modely „vidia“ v posuvnom okienku relevantnosti, sa neustále mení – a s ním sa mení aj kvalita výsledkov práce AI/ML modelov trénovaných na jednom z „rámcov“ v minulosti. . Ak sa kvalita výsledkov práce modelov AI/ML zhorší (napríklad: hodnota chyby klasifikácie „alarm-norma“ prekročila nami definované limity), malo by sa automaticky spustiť ďalšie školenie modelov. aktuálnejší „rámec“ - a výber momentu na spustenie dodatočného školenia modelov by mal zohľadňovať, ako trvanie samotného školenia a dynamika zhoršovania kvality práce aktuálnej verzie modelov (od aktuálne verzie modelov sa naďalej používajú, kým sa modely trénujú a kým sa nevytvoria ich „novotrénované“ verzie).

InterSystems IRIS má kľúčové možnosti platformy umožňujúce riešenia AI/ML pre riadenie procesov v reálnom čase. Tieto schopnosti možno rozdeliť do troch hlavných skupín:

  • Nepretržité nasadenie (Continuous Deployment/Delivery, CD) nových alebo prispôsobených existujúcich mechanizmov AI/ML do produktívneho riešenia fungujúceho v reálnom čase na platforme InterSystems IRIS
  • Nepretržitá integrácia (CI) do jediného produktívneho riešenia prichádzajúcich dátových tokov technologických procesov, dátových frontov na aplikáciu/tréning/kontrolu kvality mechanizmov AI/ML a výmeny dát/kódu/kontrolných akcií s prostrediami matematického modelovania, organizované v reálnom čase platforma InterSystems IRIS
  • Nepretržité (samo)trénovanie (Continuous Training, CT) mechanizmov AI/ML, vykonávané v prostredí matematického modelovania pomocou údajov, kódu a kontrolných akcií („rozhodnutia“) prenášaných platformou InterSystems IRIS

Zaradenie schopností platformy vo vzťahu k strojovému učeniu a umelej inteligencii práve do týchto skupín nie je náhodné. Citujme metodológiu uverejnenie Google, ktorý poskytuje koncepčný základ pre túto klasifikáciu, v našom preklade:

“... Dnes populárny koncept DevOps zastrešuje vývoj a prevádzku rozsiahlych informačných systémov. Výhody implementácie tohto konceptu sú skrátenie trvania vývojových cyklov, rýchlejšie nasadenie vývoja a flexibilita pri plánovaní vydania. Na dosiahnutie týchto výhod DevOps zahŕňa implementáciu aspoň dvoch postupov:

  • Nepretržitá integrácia (CI)
  • Nepretržité doručovanie (CD)

Tieto postupy sa vzťahujú aj na platformy AI/ML, aby sa zabezpečila spoľahlivá a výkonná montáž produktívnych riešení AI/ML.

Platformy AI/ML sa líšia od iných informačných systémov v týchto aspektoch:

  • Tímové kompetencie: Pri vytváraní riešenia AI/ML sú v tíme zvyčajne dátoví vedci alebo „akademickí“ odborníci v oblasti výskumu dát, ktorí vykonávajú analýzu dát, vyvíjajú a testujú modely. Títo členovia tímu nemusia byť profesionálnymi vývojármi produktívneho kódu.
  • Vývoj: AI/ML motory majú experimentálny charakter. Pre čo najefektívnejšie riešenie problému je potrebné prejsť rôznymi kombináciami vstupných premenných, algoritmov, metód modelovania a parametrov modelu. Zložitosť takéhoto hľadania spočíva v sledovaní toho, „čo fungovalo/nefungovalo“, v zabezpečení reprodukovateľnosti epizód, zovšeobecnení vývoja pre opakované implementácie.
  • Testovanie: Testovanie motorov AI/ML si vyžaduje širšiu škálu testov ako väčšina ostatných vývojov. Okrem štandardných jednotkových a integračných testov sa testuje validita údajov a kvalita výsledkov aplikácie modelu na trénovacie a kontrolné vzorky.
  • Nasadzovanie: Nasadzovanie riešení AI/ML sa neobmedzuje len na prediktívne služby, ktoré využívajú raz natrénovaný model. Riešenia AI/ML sú postavené na viacstupňových potrubiach, ktoré vykonávajú automatizovaný modelový tréning a aplikáciu. Nasadenie takýchto potrubí zahŕňa automatizáciu netriviálnych akcií, ktoré tradične vykonávajú manuálne vedci údajov, aby bolo možné trénovať a testovať modely.
  • Produktivita: AI/ML motorom môže chýbať produktivita nielen kvôli neefektívnemu programovaniu, ale aj kvôli neustále sa meniacej povahe vstupných údajov. Inými slovami, výkonnosť mechanizmov AI/ML sa môže zhoršiť zo širšieho okruhu dôvodov ako výkonnosť konvenčného vývoja. Čo vedie k potrebe monitorovať (online) výkon našich AI/ML motorov, ako aj posielať upozornenia alebo odmietať výsledky, ak ukazovatele výkonu nespĺňajú očakávania.

Platformy AI/ML sú podobné iným informačným systémom v tom, že obe vyžadujú nepretržitú integráciu kódu s kontrolou verzií, testovaním jednotiek, testovaním integrácie a nasadením neustáleho vývoja. V prípade AI/ML však existuje niekoľko dôležitých rozdielov:

  • CI (Continuous Integration) sa už neobmedzuje len na testovanie a overovanie kódu nasadených komponentov – zahŕňa aj testovanie a overovanie údajov a modelov AI/ML.
  • CD (Continuous Delivery/Deployment, kontinuálne nasadzovanie) sa neobmedzuje len na písanie a uvoľňovanie balíkov alebo služieb, ale zahŕňa platformu na zostavovanie, školenie a aplikáciu riešení AI/ML.
  • CT (Continuous Training, kontinuálne vzdelávanie) je nový prvok [cca. autor článku: nový prvok vo vzťahu k tradičnému konceptu DevOps, v ktorom je CT spravidla nepretržité testovanie], vlastné platformám AI/ML, zodpovedné za autonómne riadenie mechanizmov na školenie a aplikáciu AI /ML modely. ..."

Môžeme konštatovať, že strojové učenie a umelá inteligencia pracujúca na dátach v reálnom čase si vyžaduje širší súbor nástrojov a kompetencií (od vývoja kódu až po orchestráciu prostredí matematického modelovania), užšiu integráciu medzi všetkými funkčnými a tematickými oblasťami, efektívnejšiu organizáciu ľudských a strojové prostriedky.

Scenár v reálnom čase: rozpoznanie vývoja porúch napájacích čerpadiel

Pokračujúc v používaní oblasti riadenia procesu ako príkladu, zvážte špecifický problém (už sme spomenuli na úplnom začiatku): musíme zabezpečiť monitorovanie vývoja porúch v čerpadlách v reálnom čase na základe toku hodnôt parametrov procesu a správy od opravárov o zistených závadách.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 2 Formulácia problému na sledovanie vývoja defektov

Znakom väčšiny takto kladených úloh v praxi je, že pravidelnosť a efektívnosť príjmu dát (APCS) je potrebné posudzovať na pozadí občasného a nepravidelného výskytu (a registrácie) defektov rôzneho druhu. Inými slovami: údaje zo systému riadenia procesov prichádzajú raz za sekundu, správne a presné, poznámky o chybách sa robia chemickou ceruzkou s uvedením dátumu vo všeobecnom zápisníku v dielni (napríklad: „12.01 – únik do krytu zo strany 3. ložiska“).

Formuláciu problému teda môžeme doplniť o nasledujúce dôležité obmedzenie: máme len jednu „nálepku“ defektu konkrétneho typu (t. j. príklad defektu konkrétneho typu predstavujú dáta z riadenia procesu systému ku konkrétnemu dátumu – a nemáme viac príkladov závady tohto konkrétneho typu). Toto obmedzenie nás okamžite posúva mimo rámec klasického strojového učenia (učenie pod dohľadom), pre ktoré by malo existovať množstvo „tagov“.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 3 Objasnenie úlohy sledovania vývoja defektov

Môžeme nejako „rozmnožiť“ jediný „tag“, ktorý máme k dispozícii? Áno, môžme. Súčasný stav čerpadla je charakterizovaný mierou podobnosti s registrovanými poruchami. Dokonca aj bez použitia kvantitatívnych metód, na úrovni vizuálneho vnímania, pozorovaním dynamiky údajových hodnôt prichádzajúcich zo systému riadenia procesov sa už môžete veľa naučiť:

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 4 Dynamika stavu čerpadla na pozadí „značky“ defektu daného typu

Ale vizuálne vnímanie (aspoň zatiaľ) nie je najvhodnejším generátorom „tagov“ v našom rýchlo sa meniacom scenári. Pomocou štatistického testu vyhodnotíme podobnosť aktuálneho stavu čerpadla s nahlásenými poruchami.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 5 Aplikácia štatistického testu na prichádzajúce údaje na pozadí „štítku“ defektu

Štatistický test určuje pravdepodobnosť, že záznamy s hodnotami parametrov technologického procesu v „flow-packete“ prijaté zo systému riadenia procesu sú podobné záznamom „značky“ defektu určitého typu. Hodnota pravdepodobnosti (index štatistickej podobnosti) vypočítaná ako výsledok aplikovania štatistického testu sa prevedie na hodnotu 0 alebo 1, čím sa stane „označením“ strojového učenia v každom konkrétnom zázname v pakete, ktorý sa skúma na podobnosť. To znamená, že po spracovaní novoprijatého balíka záznamov stavu pumpy so štatistickým testom máme možnosť (a) pridať tento balík do tréningovej sady na trénovanie modelu AI/ML a (b) vykonať kontrolu kvality aktuálnu verziu modelu pri použití k tomuto balíku.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 6 Aplikácia modelu strojového učenia na prichádzajúce údaje na pozadí „označenia“ defektu

V jednom z našich predchádzajúcich webináre Ukazujeme a vysvetľujeme, ako platforma InterSystems IRIS umožňuje implementovať akýkoľvek mechanizmus AI/ML vo forme nepretržite vykonávaných obchodných procesov, ktoré monitorujú spoľahlivosť výsledkov modelovania a prispôsobujú parametre modelu. Pri implementácii prototypu nášho scenára s pumpami využívame všetku funkcionalitu InterSystems IRIS prezentovanú počas webinára – implementujeme do procesu analyzátora ako súčasť nášho riešenia nie klasické učenie pod dohľadom, ale skôr posilňovacie učenie, ktoré automaticky riadi výber tréningových modelov. . Tréningová vzorka obsahuje záznamy, na ktorých vzniká „detekčný konsenzus“ po aplikovaní štatistického testu aj aktuálnej verzie modelu – t.j. štatistického testu (po transformácii indexu podobnosti na 0 alebo 1), ako aj modelu, ktorý priniesol výsledok. o takýchto záznamoch 1. Pri novom trénovaní modelu pri jeho validácii (novo trénovaný model je aplikovaný na vlastnú trénovaciu vzorku s predbežnou aplikáciou štatistického testu na ňu) záznamy, ktoré po spracovaní „nezachovali“ výsledok 1 štatistickým testom (vzhľadom na neustálu prítomnosť v tréningu vzorka záznamov z pôvodného „štítku“ defektu), sú odstránené z tréningového súboru a nová verzia modelu sa učí z „štítku“ defektu. defekt plus „zachované“ záznamy zo streamu.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 7 Robotizácia výpočtov AI/ML v InterSystems IRIS

Ak je potrebný akýsi „druhý názor“ na kvalitu detekcie získanej počas lokálnych výpočtov v InterSystems IRIS, vytvorí sa poradenský proces, ktorý vykoná školenie a aplikáciu modelov na množine riadiacich údajov pomocou cloudových služieb (napríklad Microsoft Azure, Amazon Web Services, Google Cloud Platform atď.):

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 8 Druhé stanovisko od Microsoft Azure riadené InterSystems IRIS

Prototyp nášho scenára v InterSystems IRIS je navrhnutý ako systém analytických procesov založený na agentoch, ktoré interagujú s objektom zariadenia (pumpa), prostrediami matematického modelovania (Python, R a Julia) a zabezpečujú samoučenie všetkých zúčastnených AI/ Mechanizmy ML – na dátových tokoch v reálnom čase .

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 9 Hlavná funkcionalita riešenia AI/ML v reálnom čase v InterSystems IRIS

Praktický výsledok nášho prototypu:

  • Vzorová chyba rozpoznaná modelom (12. januára):

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase

  • Vyvíjajúca sa chyba rozpoznaná modelom, ktorý nebol zahrnutý vo vzorke (11. septembra, samotnú chybu identifikoval tím opravy až o dva dni neskôr, 13. septembra):

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Simulácia na reálnych dátach obsahujúcich niekoľko epizód toho istého defektu ukázala, že naše riešenie implementované na platforme InterSystems IRIS nám umožňuje identifikovať vývoj defektov tohto typu niekoľko dní predtým, ako ich odhalí opravárenský tím.

InterSystems IRIS - univerzálna výpočtová platforma AI/ML v reálnom čase

Platforma InterSystems IRIS zjednodušuje vývoj, nasadenie a prevádzku dátových riešení v reálnom čase. InterSystems IRIS je schopný súčasne vykonávať transakčné a analytické spracovanie údajov; podporovať synchronizované zobrazenia údajov podľa viacerých modelov (vrátane relačných, hierarchických, objektových a dokumentových); pôsobiť ako platforma na integráciu širokého spektra zdrojov údajov a jednotlivých aplikácií; poskytujú pokročilé analýzy v reálnom čase pre štruktúrované a neštruktúrované údaje. InterSystems IRIS tiež poskytuje mechanizmy na používanie externých analytických nástrojov a umožňuje flexibilnú kombináciu hostingu v cloude a na lokálnych serveroch.

Aplikácie postavené na platforme InterSystems IRIS sa nasadzujú v rôznych odvetviach a pomáhajú spoločnostiam realizovať významné ekonomické výhody zo strategického a prevádzkového hľadiska, zvyšujú informované rozhodovanie a premosťujú medzery medzi udalosťou, analýzou a akciou.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 10 Architektúra InterSystems IRIS v kontexte AI/ML v reálnom čase

Podobne ako predchádzajúci diagram, aj nižšie uvedený diagram kombinuje nový „súradnicový systém“ (CD/CI/CT) s diagramom toku informácií medzi pracovnými prvkami platformy. Vizualizácia začína makromechanizmom CD a pokračuje makromechanizmom CI a CT.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 11 Schéma informačných tokov medzi prvkami AI/ML platformy InterSystems IRIS

Podstata mechanizmu CD v InterSystems IRIS: používatelia platformy (vývojári riešení AI/ML) prispôsobujú existujúce a/alebo vytvárajú nové vývojové verzie AI/ML pomocou špecializovaného editora kódu pre mechanizmy AI/ML: Jupyter (celý názov: Jupyter Notebook; pre stručnosť sa niekedy nazývajú aj dokumenty vytvorené v tomto editore). V Jupyter má vývojár možnosť písať, ladiť a overovať výkon (vrátane použitia grafiky) konkrétneho vývoja AI/ML pred jeho umiestnením („nasadením“) do InterSystems IRIS. Je jasné, že takto vytvorený nový vývoj dostane len základné ladenie (keďže Jupyter najmä nepracuje s dátovými tokmi v reálnom čase) - je to v poradí vecí, pretože hlavným výsledkom vývoja v Jupyteri je potvrdením základnej funkčnosti samostatného mechanizmu AI / ML („ukáže očakávaný výsledok na vzorke údajov“). Podobne mechanizmus už umiestnený v platforme (pozri nasledujúce makromechanizmy) pred ladením v Jupyteri môže vyžadovať „rollback“ do „predplatformového“ formulára (čítanie údajov zo súborov, práca s údajmi cez xDBC namiesto tabuliek, priama interakcia s globálnymi – multidimenzionálne dátové polia InterSystems IRIS – atď.).

Dôležitý aspekt implementácie CD v InterSystems IRIS: medzi platformou a Jupyter bola implementovaná obojsmerná integrácia, čo umožňuje preniesť obsah v Pythone, R a Julia na platformu (a následne spracovať v platforme) (všetky tri programujú jazykoch v zodpovedajúcich popredných open-source jazykoch). zdrojové matematické modelovacie prostredia). Vývojári obsahu AI/ML tak majú možnosť vykonávať „nepretržité nasadzovanie“ tohto obsahu na platforme, pričom pracujú v ich známom editore Jupyter, so známymi knižnicami dostupnými v Pythone, R, Julia a vykonávajú základné ladenie (ak je to potrebné). mimo platformy.

Prejdime k makro mechanizmu CI v InterSystems IRIS. Diagram ukazuje makro proces „robotizéra v reálnom čase“ (komplex dátových štruktúr, obchodných procesov a fragmentov kódu, ktoré riadia v matematických jazykoch a ObjectScript – natívnom vývojovom jazyku InterSystems IRIS). Úlohou tohto makroprocesu je udržiavať dátové fronty potrebné na fungovanie mechanizmov AI/ML (na základe dátových tokov prenášaných na platformu v reálnom čase), rozhodovať o postupnosti aplikácie a „sortimente“ AI/ Mechanizmy ML (sú to aj „matematické algoritmy“, „modely“ atď. – možno ich nazvať rôzne v závislosti od špecifík implementácie a terminologických preferencií), udržiavať dátové štruktúry aktuálne pre analýzu výsledkov práce AI/ ML mechanizmy (kocky, tabuľky, multidimenzionálne dátové polia atď.) atď. – pre zostavy, dashboardy atď.).

Dôležitý aspekt implementácie CI v InterSystems IRIS: medzi platformou a prostrediami matematického modelovania bola implementovaná obojsmerná integrácia, ktorá vám umožňuje spúšťať obsah hostovaný na platforme v jazykoch Python, R a Julia v ich príslušných prostrediach a získavať späť výsledky vykonania. Táto integrácia je implementovaná v „terminálnom režime“ (t. j. obsah AI/ML je formulovaný ako kód ObjectScript, ktorý volá do prostredia), ako aj v „režime obchodného procesu“ (t. j. obsah AI/ML je formulovaný ako obchodný proces pomocou grafického editora alebo niekedy pomocou Jupyter, alebo pomocou IDE - IRIS Studio, Eclipse, Visual Studio Code). Dostupnosť obchodných procesov na úpravu v Jupyter sa odráža prostredníctvom prepojenia medzi IRIS na úrovni CI a Jupyter na úrovni CD. Podrobnejší prehľad integrácie s prostrediami matematického modelovania je uvedený nižšie. V tejto fáze sú podľa nášho názoru všetky dôvody zabezpečiť, aby platforma mala všetky potrebné nástroje na implementáciu „nepretržitej integrácie“ vývoja AI/ML (pochádzajúceho z „nepretržitého nasadzovania“) do riešení AI/ML v reálnom čase.

A hlavný makro mechanizmus: CT. Bez nej nebude existovať platforma AI/ML (hoci „reálny čas“ bude implementovaný prostredníctvom CD/CI). Podstatou CT je práca platformy s „artefaktmi“ strojového učenia a umelej inteligencie priamo v pracovných reláciách prostredí matematického modelovania: modely, distribučné tabuľky, maticové vektory, vrstvy neurónových sietí atď. Táto „práca“ vo väčšine prípadov spočíva vo vytváraní spomínaných artefaktov v prostrediach (v prípade modelov napr. „tvorba“ spočíva v nastavení špecifikácie modelu a následnom výbere hodnôt jeho parametrov - takzvaný „tréning“ modelu), ich aplikácia (pre modely: výpočet pomocou „modelových“ hodnôt cieľových premenných – prognózy, príslušnosť ku kategórii, pravdepodobnosť udalosti a pod.) a zlepšenie už vytvorené a aplikované artefakty (napríklad predefinovanie súboru vstupných premenných modelu na základe výsledkov aplikácie - s cieľom zlepšiť presnosť predpovedí, ako možnosť). Kľúčovým bodom v pochopení úlohy CT je jeho „abstrakcia“ od reality CD a CI: CT bude implementovať všetky artefakty so zameraním na výpočtové a matematické špecifiká riešenia AI/ML v rámci možností poskytovaných špecifickými prostrediami. Zodpovednosť za „poskytovanie vstupov“ a „dodávanie výstupov“ bude zodpovedať CD a CI.

Dôležitým aspektom implementácie CT špecificky v InterSystems IRIS: pomocou integrácie s matematickými modelovacími prostrediami, ktoré už boli spomenuté vyššie, má platforma schopnosť extrahovať práve tieto artefakty z pracovných relácií prebiehajúcich pod jej kontrolou v matematických prostrediach a (čo je najdôležitejšie) otáčať do dátových objektov platformy. Napríklad distribučnú tabuľku, ktorá bola práve vytvorená v pracovnej relácii Pythonu, možno (bez zastavenia relácie Pythonu) preniesť na platformu napríklad vo forme globálnej (viacrozmerné dátové pole InterSystems IRIS) – a použiť pre výpočty v inom mechanizme AI/ML- (implementovaný v jazyku iného prostredia - napríklad v R) - alebo virtuálnej tabuľke. Ďalší príklad: paralelne s „normálnym režimom“ prevádzky modelu (v pracovnej relácii Pythonu) sa na jeho vstupných údajoch vykonáva „auto-ML“: automatický výber optimálnych vstupných premenných a hodnôt parametrov. A spolu s „bežným“ tréningom dostáva produktívny model v reálnom čase aj „návrh na optimalizáciu“ svojej špecifikácie – v ktorej sa mení množina vstupných premenných, menia sa hodnoty parametrov (už nie ako výsledok tréningu v Pythone, ale ako výsledok tréningu s „alternatívnou“ verziou samej seba, ako je zásobník H2O), čo umožňuje celkovému riešeniu AI/ML autonómne sa vyrovnať s neočakávanými zmenami v povahe vstupných údajov a javov, ktoré sa modelujú. .

Zoznámime sa podrobnejšie s funkcionalitou platformy AI/ML InterSystems IRIS na príklade reálneho prototypu.

V nižšie uvedenom diagrame je na ľavej strane snímky časť obchodného procesu, ktorá implementuje vykonávanie skriptov v Pythone a R. V centrálnej časti sú vizuálne protokoly vykonávania niektorých z týchto skriptov, resp. v Pythone a R. Bezprostredne za nimi sú príklady obsahu v jednom a inom jazyku, prenesené na spustenie do príslušných prostredí. Na konci vpravo sú vizualizácie založené na výsledkoch vykonania skriptu. Vizualizácie v hornej časti boli vytvorené na IRIS Analytics (údaje boli prevzaté z Pythonu do dátovej platformy InterSystems IRIS a zobrazené na dashboarde pomocou platformy), v dolnej časti boli vytvorené priamo v pracovnej relácii R a odtiaľ výstup do grafických súborov. . Dôležitý aspekt: ​​prezentovaný fragment v prototype je zodpovedný za trénovanie modelu (klasifikácia stavov zariadení) na dátach prijatých v reálnom čase z procesu simulátora vybavenia, na príkaz z procesu monitorovania kvality klasifikácie pozorovaného počas aplikácie modelu. Ďalej sa bude diskutovať o implementácii riešenia AI/ML vo forme súboru interagujúcich procesov („agentov“).

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 12 Interakcia s Pythonom, R a Juliou v InterSystems IRIS

Procesy platformy (sú to tiež „obchodné procesy“, „analytické procesy“, „potrubia“ atď. - v závislosti od kontextu) sa v prvom rade upravujú v grafickom editore podnikových procesov v samotnej platforme, a to napr. spôsobom, že jeho bloková schéma a zodpovedajúci mechanizmus AI/ML (programový kód) sú vytvorené súčasne. Keď hovoríme, že „je získaný mechanizmus AI/ML“, máme na začiatku na mysli hybridnosť (v rámci jedného procesu): obsah v jazykoch prostredí matematického modelovania susedí s obsahom v SQL (vrátane rozšírení z IntegratedML), v InterSystems ObjectScript, s ďalšími podporovanými jazykmi. Proces platformy navyše poskytuje veľmi široké možnosti „vykresľovania“ vo forme hierarchicky vnorených fragmentov (ako je možné vidieť na príklade v diagrame nižšie), čo vám umožňuje efektívne organizovať aj veľmi zložitý obsah bez toho, aby ste „vypadli“ grafického formátu (do „negrafických“ formátov). » metódy/triedy/postupy atď.). To znamená, že ak je to potrebné (a predpokladá sa to vo väčšine projektov), ​​môže byť úplne celé riešenie AI/ML implementované v grafickom samodokumentačnom formáte. Upozorňujeme, že v centrálnej časti nižšie uvedeného diagramu, ktorá predstavuje vyššiu „úroveň vnorenia“, je zrejmé, že okrem samotnej práce na trénovaní modelu (pomocou Pythonu a R) je potrebné vykonať analýzu tzv. Je pridaná ROC krivka trénovaného modelu, ktorá umožňuje vizuálne (a tiež výpočtovo) vyhodnotiť kvalitu tréningu - a táto analýza je implementovaná v jazyku Julia (vykonávaná podľa toho v matematickom prostredí Julia).

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 13 Vizuálne prostredie pre kompozíciu AI/ML riešení v InterSystems IRIS

Ako už bolo spomenuté, počiatočný vývoj a (v niektorých prípadoch) prispôsobenie mechanizmov AI/ML už implementovaných v platforme bude/môže byť vykonané mimo platformy v editore Jupyter. V nižšie uvedenom diagrame vidíme príklad prispôsobenia existujúceho procesu platformy (rovnako ako v diagrame vyššie) - takto vyzerá fragment, ktorý je zodpovedný za trénovanie modelu v Jupyter. Obsah Pythonu je k dispozícii na úpravu, ladenie a grafický výstup priamo v Jupyteri. Zmeny (v prípade potreby) je možné vykonať s okamžitou synchronizáciou do procesu platformy, vrátane jej produktívnej verzie. Nový obsah je možné preniesť na platformu podobným spôsobom (automaticky sa vygeneruje nový proces platformy).

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 14 Použitie Jupyter Notebooku na úpravu AI/ML enginu v platforme InterSystems IRIS

Prispôsobenie procesu platformy je možné vykonávať nielen v grafickom alebo prenosnom formáte, ale aj vo formáte „totálneho“ IDE (Integrated Development Environment). Tieto IDE sú IRIS Studio (natívne IRIS štúdio), Visual Studio Code (InterSystems IRIS rozšírenie pre VSCode) a Eclipse (Atelier plugin). V niektorých prípadoch je možné, aby vývojový tím používal všetky tri IDE súčasne. Nižšie uvedený diagram ukazuje príklad úpravy rovnakého procesu v IRIS Studio, Visual Studio Code a Eclipse. Úplne všetok obsah je k dispozícii na úpravu: Python/R/Julia/SQL, ObjectScript a obchodné procesy.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 15 Vývoj obchodného procesu InterSystems IRIS v rôznych IDE

Osobitnú zmienku si zaslúžia nástroje na popis a vykonávanie obchodných procesov InterSystems IRIS v jazyku Business Process Language (BPL). BPL umožňuje používať „pripravené integračné komponenty“ (aktivity) v obchodných procesoch – čo v skutočnosti dáva všetky dôvody na to, aby sa v InterSystems IRIS implementovalo „nepretržitá integrácia“. Hotové komponenty podnikových procesov (aktivity a prepojenia medzi nimi) sú výkonným akcelerátorom pre zostavenie AI/ML riešenia. A nielen zostavy: vďaka činnostiam a prepojeniam medzi nimi nad rôznorodým vývojom a mechanizmami AI/ML vzniká „vrstva autonómneho riadenia“, ktorá je schopná rozhodovať sa podľa situácie v reálnom čase.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 16 Hotové komponenty podnikových procesov pre kontinuálnu integráciu (CI) na platforme InterSystems IRIS

Koncept agentových systémov (známy aj ako „multi-agentové systémy“) má v robotizácii silné postavenie a platforma InterSystems IRIS ho organicky podporuje prostredníctvom konštrukcie „produkt-proces“. Okrem neobmedzených možností „napchať“ každý proces funkcionalitou potrebnou pre celkové riešenie, vybavenie systému platformových procesov vlastnosťou „agentúry“ umožňuje vytvárať efektívne riešenia pre extrémne nestabilné simulované javy (správanie sociálnych/ biosystémy, čiastočne pozorovateľné technologické procesy a pod.).

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 16 Prevádzka riešenia AI/ML ako systému podnikových procesov založeného na agentoch v InterSystems IRIS

Pokračujeme v našej recenzii InterSystems IRIS príbehom o aplikovanom použití platformy na riešenie celých tried problémov v reálnom čase (pomerne podrobný úvod do niektorých najlepších postupov platformy AI/ML na InterSystems IRIS nájdete v jednom nášho predchádzajúceho webináre).

Nasleduje predchádzajúci diagram, nižšie je podrobnejší diagram systému agentov. Diagram zobrazuje rovnaký prototyp, sú viditeľné všetky štyri procesy agentov, schematicky sú nakreslené vzťahy medzi nimi: GENERATOR - spracováva vytváranie údajov pomocou snímačov zariadení, BUFFER - spravuje fronty údajov, ANALYZER - sám vykonáva strojové učenie, MONITOR - monitoruje kvalitu strojového učenia a odošle signál o potrebe preškolenia modelu.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 17 Zloženie riešenia AI/ML vo forme systému podnikových procesov na báze agentov v InterSystems IRIS

Nižšie uvedený diagram ilustruje autonómne fungovanie ďalšieho robotického prototypu (rozpoznanie emocionálneho zafarbenia textov) na určitý čas. V hornej časti je evolúcia indikátora kvality modelového tréningu (kvalita rastie), v dolnej časti je dynamika indikátora kvality aplikácie modelu a skutočnosti opakovaného tréningu (červené pruhy). Ako vidíte, riešenie sa naučilo efektívne a autonómne a funguje na danej úrovni kvality (hodnoty skóre kvality neklesnú pod 80%).

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 18 Kontinuálny (samo)tréning (CT) na platforme InterSystems IRIS

Už sme spomenuli aj „auto-ML“, ale nižšie uvedený diagram ukazuje použitie tejto funkcie podrobne na príklade iného prototypu. Grafický diagram fragmentu obchodného procesu zobrazuje aktivitu, ktorá spúšťa modelovanie v zásobníku H2O, ukazuje výsledky tohto modelovania (jasná dominancia výsledného modelu nad modelmi vytvorenými človekom, podľa porovnávacieho diagramu ROC krivky, ako aj automatizovaná identifikácia „najvplyvnejších premenných“ dostupných v pôvodnom súbore údajov). Dôležitým bodom je tu úspora času a odborných zdrojov, ktorá sa dosahuje prostredníctvom „auto-ML“: to, čo proces našej platformy urobí za pol minúty (nájdenie a zaškolenie optimálneho modelu), môže odborníkovi trvať týždeň až mesiac.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 19 Integrácia „auto-ML“ do riešenia AI/ML na platforme InterSystems IRIS

Nižšie uvedený diagram sa trochu míňa pointe, ale je to dobrý spôsob, ako ukončiť príbeh o triedach problémov v reálnom čase, ktoré sa riešia: pripomíname vám, že so všetkými možnosťami platformy InterSystems IRIS sú tréningové modely pod jej kontrolou. nie je povinné. Platforma môže zvonku prijímať takzvanú PMML špecifikáciu modelu, trénovanú v nástroji, ktorý platforma nemá pod kontrolou – a aplikovať tento model v reálnom čase od momentu jeho importu. Špecifikácie PMML. Je dôležité vziať do úvahy, že nie všetky artefakty AI/ML je možné zredukovať na špecifikáciu PMML, aj keď to väčšina najbežnejších artefaktov umožňuje. Platforma InterSystems IRIS je teda „otvorenou slučkou“ a pre používateľov neznamená „otroctvo platformy“.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 20 Integrácia „auto-ML“ do riešenia AI/ML na platforme InterSystems IRIS

Uveďme si ďalšie výhody platformy InterSystems IRIS (pre prehľadnosť vo vzťahu k riadeniu procesov), ktoré majú veľký význam pri automatizácii umelej inteligencie a strojovom učení v reálnom čase:

  • Vyvinuté integračné nástroje s akýmikoľvek zdrojmi údajov a spotrebiteľmi (systém riadenia procesov/SCADA, vybavenie, MRO, ERP atď.)
  • Vstavaný multi-model DBMS pre vysokovýkonné transakčné a analytické spracovanie (Hybrid Transaction/Analytical Processing, HTAP) akéhokoľvek objemu dát technologických procesov
  • Vývojové nástroje pre nepretržité nasadenie AI/ML motorov pre riešenia v reálnom čase založené na Pythone, R, Julia
  • Adaptívne obchodné procesy pre nepretržitú integráciu a (samo)učenie motorov riešení AI/ML v reálnom čase
  • Vstavané nástroje Business Intelligence na vizualizáciu procesných dát a výsledkov riešenia AI/ML
  • Správa API za dodávanie výsledkov riešenia AI/ML do systémov riadenia procesov/SCADA, informačných a analytických systémov, zasielanie upozornení a pod.

Riešenia AI/ML na platforme InterSystems IRIS ľahko zapadnú do existujúcej IT infraštruktúry. Platforma InterSystems IRIS zaisťuje vysokú spoľahlivosť riešení AI/ML podporou konfigurácií odolných voči chybám a katastrofám a flexibilného nasadenia vo virtuálnych prostrediach, na fyzických serveroch, v súkromných a verejných cloudoch a kontajneroch Docker.

InterSystems IRIS je teda univerzálna výpočtová platforma AI/ML v reálnom čase. Univerzálnosť našej platformy v praxi potvrdzuje absencia faktických obmedzení na zložitosť implementovaných výpočtov, schopnosť InterSystems IRIS kombinovať (v reálnom čase) spracovanie scenárov zo širokej škály odvetví a výnimočná adaptabilita akékoľvek funkcie a mechanizmy platformy podľa špecifických potrieb používateľov.

InterSystems IRIS - univerzálna platforma AI/ML v reálnom čase
Obrázok 21 InterSystems IRIS – univerzálna výpočtová platforma AI/ML v reálnom čase

Pre vecnejšiu interakciu s tými našimi čitateľmi, ktorí sa zaujímajú o tu prezentovaný materiál, odporúčame neobmedzovať sa len na jeho čítanie a pokračovať v dialógu „naživo“. Radi poskytneme podporu pri formulovaní scenárov AI/ML v reálnom čase vo vzťahu k špecifikám vašej spoločnosti, zrealizujeme spoločné prototypovanie na platforme InterSystems IRIS, sformulujeme a zavedieme do praxe cestovnú mapu pre zavedenie umelej inteligencie a strojového učenia do vašich výrobných a riadiacich procesov. Kontaktný e-mail nášho tímu odborníkov na AI/ML – [chránené e-mailom].

Zdroj: hab.com

Pridať komentár