InterSystems IRIS - univerzální platforma AI/ML v reálném čase

Autor: Sergey Lukyanchikov, InterSystems Consulting Engineer

Výzvy AI/ML v reálném čase

Začněme příklady ze zkušeností z praxe Data Science ve společnosti InterSystems:

  • „Nabitý“ nákupní portál je napojen na online doporučující systém. Přichází restrukturalizace promoakcí v měřítku maloobchodní sítě (např. místo „ploché“ linie promoakcí bude nyní použita matice „segment-taktika“). Co se stane s doporučujícími? Co se stane s předáváním a aktualizací dat do doporučovacího mechanismu (objem vstupních dat se zvýšil 25000 XNUMXkrát)? Co se stane s vývojem doporučení (potřeba tisícinásobného snížení prahu filtrování doporučujících pravidel kvůli tisícinásobnému zvýšení jejich počtu a „rozsahu“)?
  • Existuje systém sledování pravděpodobnosti vývoje závad v uzlech zařízení. K monitorovacímu systému byl připojen procesní řídicí systém, který každou sekundu přenáší tisíce procesních parametrů. Co se stane s monitorovacím systémem, který dříve pracoval na „manuálních vzorcích“ (je schopen poskytovat sekundové sledování pravděpodobnosti)? Co se stane, když se ve vstupních datech objeví nový blok s několika stovkami sloupců s naměřenými hodnotami senzorů nedávno přidaných do systému řízení procesu (zda a na jak dlouho bude nutné zastavit monitorovací systém, aby data z nových senzorů byla zařazena do analýza)?
  • Byl vytvořen soubor mechanismů AI/ML (doporučující, monitorovací, prediktivní), využívající výsledky vzájemné práce. Kolik člověkohodin je měsíčně potřeba k přizpůsobení provozu tohoto komplexu změnám ve vstupních datech? Jaké je celkové „zpomalení“ podporované rozhodovacím komplexem (četnost výskytu nových podpůrných informací v něm vzhledem k četnosti výskytu nových vstupních dat)?

Shrnutím těchto a mnoha dalších příkladů jsme dospěli k formulaci výzev, které vyvstávají při přechodu na používání strojového učení a mechanismů umělé inteligence v reálném čase:

  • Jsme spokojeni s rychlostí tvorby a adaptace (na měnící se situaci) vývoje AI / ML v naší společnosti?
  • Do jaké míry podporují řešení AI/ML, která používáme, řízení podniku v reálném čase?
  • Jsou řešení AI/ML, která používáme, schopna se nezávisle (bez vývojářů) přizpůsobit změnám v datech a postupech řízení podniku?

Náš článek je podrobným přehledem schopností platformy InterSystems IRIS z hlediska univerzální podpory nasazení mechanismů AI / ML, montáže (integrace) řešení AI / ML a školení (testování) řešení AI / ML na intenzivních datech protéká. V tomto článku se zaměříme na průzkum trhu, případové studie řešení AI/ML a koncepční aspekty toho, co nazýváme platformou AI/ML v reálném čase.

Co víme z průzkumů: aplikace v reálném čase

výsledky přehledprovedené mezi přibližně 800 IT profesionály v roce 2019 společností Lightbend hovoří samy za sebe:

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 1 Přední spotřebitelé dat v reálném čase

Uveďme v našem překladu pro nás důležité fragmenty zprávy o výsledcích tohoto průzkumu:

„…Trendy popularity nástrojů pro integraci datových toků a zároveň podpora kontejnerových výpočtů poskytují synergickou odpověď na poptávku trhu po efektivnějším, racionálnějším a dynamičtějším návrhu efektivních řešení. Datové toky umožňují rychlejší přenos informací než tradiční paketová data. K tomu se přidává možnost rychle aplikovat výpočetní metody, jako jsou doporučení založená na AI/ML, k vytvoření konkurenčních výhod prostřednictvím zvýšené spokojenosti zákazníků. Závod o agilitu také ovlivňuje všechny role v paradigmatu DevOps – díky čemuž je vývoj a nasazení aplikací efektivnější. … Osm set čtyři IT profesionálů poskytlo informace o využití datových toků ve svých organizacích. Respondenti se převážně nacházeli v západních zemích (41 % v Evropě a 37 % v Severní Americe) a byli téměř rovnoměrně rozmístěni mezi malé, střední a velké společnosti. …

… Umělá inteligence není humbuk. XNUMX procent těch, kteří již využívají zpracování datových toků v produktivních aplikacích AI/ML, potvrzuje, že jejich použití v AI/ML zaznamená v příštím roce největší zisky (ve srovnání s jinými aplikacemi).

  • Podle většiny respondentů zaznamená v příštím roce největší nárůst využití datových toků ve scénářích AI / ML.
  • Aplikace v AI/ML porostou nejen prostřednictvím relativně nových typů scénářů, ale také prostřednictvím tradičních scénářů, ve kterých se stále více využívají data v reálném čase.
  • Kromě AI/ML je úroveň nadšení mezi uživateli datových kanálů IoT působivá – 48 % těch, kteří již integrovali data IoT, uvádí, že implementace scénářů na těchto datech zaznamená v blízké budoucnosti významný nárůst. … »

Z tohoto poměrně zajímavého průzkumu je vidět, že vnímání scénářů strojového učení a umělé inteligence jako lídrů ve spotřebě datových toků je již „na cestě“. Ale vnímání AI / ML v reálném čase prostřednictvím optiky DevOps se stává neméně důležitým postřehem: zde již můžeme začít hovořit o transformaci stále dominantní kultury „jednorázové AI / ML s plně dostupným souborem dat“.

Koncept platformy AI/ML v reálném čase

Jednou z typických aplikací pro AI/ML v reálném čase je řízení výrobního procesu. Na jejím příkladu as přihlédnutím k předchozím úvahám zformulujeme koncept platformy AI / ML v reálném čase.
Využití umělé inteligence a strojového učení při řízení procesů má řadu funkcí:

  • Data o stavu technologického procesu jsou přijímána intenzivně: s vysokou frekvencí a v širokém rozsahu parametrů (až desítky tisíc hodnot parametrů přenášených za sekundu ze systému řízení procesu)
  • Údaje o detekci vad, nemluvě o údajích o jejich vývoji, jsou naopak vzácné a nepravidelné, charakterizované nedostatečnou typizací vad a jejich lokalizací v čase (často reprezentované záznamy na papíře)
  • Z praktického hlediska je pro trénování a aplikaci modelů k dispozici pouze „okno relevance“ výchozích dat, odrážející dynamiku technologického procesu po přiměřený klouzavý interval, končící posledními načtenými hodnotami procesních parametrů.

Tyto vlastnosti nás nutí, kromě příjmu a základního zpracování intenzivního „širokopásmového vstupu“ z procesu v reálném čase, provádět (paralelně) aplikaci, školení a kontrolu kvality výsledků práce modelů AI / ML - také v reálném čase. „Snímek“, který naše modely „vidí“ v posuvném okně relevance, se neustále mění – a s tím se mění i kvalita výsledků práce AI / ML modelů trénovaných na jednom z „rámců“ v minulosti. . Pokud se kvalita výsledků práce modelů AI / ML zhorší (například: hodnota klasifikační chyby „alarm-norm“ přesáhla námi definované hranice), mělo by být automaticky zahájeno přeškolování modelů na více relevantní „rámec“ - a volba okamžiku zahájení rekvalifikace modelů by měla zohledňovat, jak délka samotného školení, jakož i dynamika zhoršování kvality aktuální verze modelů (od aktuálních verzí z modelů se i nadále uplatňují během trénování modelů a dokud nejsou vygenerovány jejich „nově trénované“ verze).

InterSystems IRIS má klíčové schopnosti platformy umožňující řešení AI/ML v reálném čase pro řízení procesů. Tyto možnosti lze rozdělit do tří hlavních skupin:

  • Nepřetržité nasazení (Continuous Deployment / Delivery, CD) nových nebo upravených stávajících mechanismů AI / ML do produktivního řešení, které funguje v reálném čase na platformě InterSystems IRIS
  • Nepřetržitá integrace (CI) do jediného produktivního řešení příchozích procesních datových toků, datových front pro aplikace / školení / kontrolu kvality mechanismů AI / ML a výměny dat / kódu / kontroly s prostředími matematického modelování, které jsou organizovány v reálném čase Platforma InterSystems IRIS
  • Kontinuální (samo)učení (Continuous Training, CT) mechanismů AI / ML prováděné v prostředí matematického modelování pomocí dat, kódu a kontrolních akcí („rozhodnutí“) přenášených platformou InterSystems IRIS

Zařazení schopností platformy ve vztahu ke strojovému učení a umělé inteligenci do přesně takových skupin není náhodné. Citujme metodologii vydání Google, který poskytuje koncepční základ pro tuto klasifikaci, v našem překladu:

“... Dnes populární koncept DevOps pokrývá vývoj a provoz rozsáhlých informačních systémů. Výhody implementace tohoto konceptu jsou zkrácení doby trvání vývojových cyklů, zrychlení nasazení vývoje, flexibilita plánování vydání. K dosažení těchto výhod zahrnuje DevOps implementaci alespoň dvou postupů:

  • Průběžná integrace (CI)
  • Nepřetržité doručování (CD)

Tyto postupy platí také pro platformy AI/ML, aby byla zajištěna robustní a výkonná sestavení produktivních řešení AI/ML.

Platformy AI/ML se od ostatních informačních systémů liší v následujících aspektech:

  • Týmové kompetence: Při vytváření řešení AI/ML tým obvykle zahrnuje datové vědce nebo datové vědce, kteří provádějí analýzu dat, vývoj modelů a ověřování. Tito členové týmu nemusí být profesionálními vývojáři produktivního kódu.
  • Vývoj: Mechanismy AI/ML jsou experimentální povahy. Aby bylo možné problém vyřešit co nejefektivněji, je potřeba třídit různé kombinace vstupních proměnných, algoritmů, metod modelování a parametrů modelu. Složitost takového vyhledávání spočívá ve sledování toho, „co fungovalo / nefungovalo“, zajištění reprodukovatelnosti epizod, zobecnění vývoje pro opakující se implementace.
  • Testování: Testování mechanismů AI/ML vyžaduje větší rozsah testů než většina ostatních vývojů. Kromě typických jednotkových a integračních testů se testuje validita dat a kvalita výsledků aplikace modelu na trénovací a kontrolní vzorky.
  • Nasazení: Nasazení řešení AI/ML není omezeno na prediktivní služby, které aplikují jednou vyškolený model. Řešení AI/ML jsou postavena na vícestupňových kanálech, které provádějí automatizované školení a aplikaci modelů. Nasazení takových kanálů zahrnuje automatizaci netriviálních kroků, které tradičně ručně provádějí datoví vědci, aby bylo možné trénovat a testovat modely.
  • Produktivní: AI/ML motory mohou postrádat výkon nejen kvůli neefektivnímu programování, ale také kvůli neustále se měnícímu charakteru vstupních dat. Jinými slovy, výkon mechanismů AI/ML se může zhoršovat v důsledku širší škály důvodů než výkon konvenčního vývoje. To má za následek nutnost sledovat (online) výkon našich AI/ML motorů a zasílat upozornění nebo odmítat výsledky, pokud výkon nesplňuje očekávání.

Platformy AI/ML jsou podobné jiným informačním systémům v tom, že obě vyžadují nepřetržitou integraci kódu s řízením verzí, testováním jednotek, testováním integrace a zaváděním neustálého vývoje. V případě AI/ML však existuje několik důležitých rozdílů:

  • CI (Continuous Integration) se již neomezuje pouze na testování a ověřování kódu nasazených komponent – ​​zahrnuje také testování a ověřování dat a modelů AI/ML.
  • CD (Continuous Delivery / Deployment, continuous deployment) se neomezuje na psaní a vydávání balíčků nebo služeb, ale zahrnuje platformu pro skládání, učení a aplikaci řešení AI / ML.
  • CT (Continuous Training, kontinuální učení) - nový prvek [cca. od autora článku: nový prvek ve vztahu k tradičnímu konceptu DevOps, ve kterém je CT obvykle kontinuální testování], vlastní platformám AI / ML, zodpovědný za autonomní řízení mechanismů pro učení a aplikaci modelů AI / ML. ... "

Můžeme konstatovat, že strojové učení a umělá inteligence pracující na datech v reálném čase vyžadují širší sadu nástrojů a kompetencí (od vývoje kódu po orchestraci prostředí matematického modelování), užší integraci mezi všemi funkčními a věcnými oblastmi, efektivnější organizaci lidského a strojní prostředky.

Scénář v reálném čase: Rozpoznání vývoje závad u napájecích čerpadel

Pokračujeme-li v příkladu z oblasti procesního řízení, uvažujme o konkrétním úkolu (námi již zmiňovaném na samém začátku): je třeba zajistit sledování vývoje závad v čerpadlech v reálném čase na základě toku procesních parametrů a zprávy personálu údržby o zjištěných závadách.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 2 Formulace úkolu sledování vývoje vad

Zvláštností většiny takto nastavených úkolů v praxi je, že pravidelnost a účinnost příjmu dat (APCS) je třeba posuzovat na pozadí epizodického a nepravidelného výskytu (a registrace) různých typů závad. Jinými slovy: data z procesního řídicího systému přicházejí jednou za sekundu správně-přesná a závady jsou zaznamenávány nesmazatelnou tužkou s datem v obecném zápisníku v dílně (například: „12.01 - únik do krytu z strana 3. ložiska“).

Formulaci problému je tedy možné doplnit o toto důležité omezení: máme pouze jeden „nálepek“ vady konkrétního typu (tj. příkladem vady konkrétního typu jsou data z tzv. systém řízení procesů ke konkrétnímu datu - a nemáme více příkladů závady tohoto konkrétního typu). Toto omezení nás okamžitě zavede mimo rámec klasického strojového učení (učení pod dohledem), pro které by mělo existovat mnoho „nálepků“.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 3 Zpřesnění úlohy sledování vývoje vad

Můžeme nějak "rozmnožit" jedinou "nálepku", kterou máme k dispozici? Ano, můžeme. Současný stav čerpadla je charakterizován mírou podobnosti s registrovanými závadami. I bez použití kvantitativních metod se na úrovni vizuálního vnímání, pozorováním dynamiky hodnot dat pocházejících ze systému řízení procesů, můžete již hodně naučit:

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 4 Dynamika stavu čerpadla na pozadí „známky“ závady daného typu

Ale zrakové vnímání (alespoň prozatím) není v našem rychle se měnícím scénáři tím nejvhodnějším generátorem „tagů“. Podobnost aktuálního stavu čerpadla s hlášenými závadami vyhodnotíme pomocí statistického testu.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 5 Použití statistického testu na příchozí data na pozadí „označení“ defektu

Statistický test zjišťuje pravděpodobnost, že záznamy s hodnotami parametrů technologického procesu v „flow-packet“ přijaté ze systému řízení procesu jsou podobné „label“ záznamům určitého typu závady. Hodnota pravděpodobnosti vypočítaná jako výsledek použití statistického testu (index statistické podobnosti) se převede na hodnotu 0 nebo 1 a stane se „nálepkou“ pro strojové učení v každém konkrétním záznamu v balíčku podobnosti. To znamená, že po zpracování nově přijatého balíčku záznamů stavu pumpy se statistickým testem máme možnost (a) přidat tento balíček do trénovacího vzorku pro trénování modelu AI ​​/ML a (b) sledovat kvalitu aktuální verzi modelu, když je aplikována na tento balíček.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 6 Aplikace modelu strojového učení na příchozí data na pozadí „označení“ defektu

V jednom z našich předchozích webináře ukážeme a vysvětlíme, jak platforma InterSystems IRIS umožňuje implementovat jakýkoli mechanismus AI / ML ve formě kontinuálně prováděných obchodních procesů, které řídí spolehlivost výsledků simulace a přizpůsobují parametry modelu. Při implementaci prototypu našeho scénáře s pumpami využíváme veškerou funkcionalitu InterSystems IRIS prezentovanou během webináře – implementujeme do procesu analyzátoru jako součást našeho řešení nikoli klasické supervidované učení, ale spíše posilové učení, které automaticky řídí vzorek pro trénink modely. Záznamy jsou umístěny do trénovacího vzorku, na kterém dochází k „detekčnímu konsenzu“ po aplikaci jak statistického testu, tak aktuální verze modelu – tedy jak statistického testu (po transformaci indexu podobnosti na 0 nebo 1), tak i model vytvořil výsledek na takových záznamech 1. S novým trénováním modelu se při jeho validaci (nově trénovaný model je aplikován na vlastní trénovací vzorek s předběžnou aplikací statistického testu na něj) zaznamená, že „nedošlo k hold“ je z trénovacího vzorku odstraněn výsledek 1 po zpracování statistickým testem (vzhledem k neustálé přítomnosti v tréninku vzorek záznamů z původního „nápisu“ závady) a nová verze modelu se učí z "štítek" závady plus "držené" záznamy z proudu.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 7 Robotizace výpočtů AI/ML v InterSystems IRIS

Pokud je potřeba jakýsi „druhý názor“ na kvalitu detekce získanou lokálním počítačem v InterSystems IRIS, je vytvořen poradní proces, který provede tréninkové modely na řídicí datové sadě pomocí cloudových služeb (například Microsoft Azure , Amazon Web Services , Google Cloud Platform atd.):

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 8 Druhý názor od Microsoft Azure organizovaný InterSystems IRIS

Prototyp našeho scénáře v InterSystems IRIS je vytvořen ve formě systému analytických procesů založených na agentech, které interagují s objektem zařízení (čerpadlo), matematickým modelovacím prostředím (Python, R a Julia) a umožňují samoučení všech zapojené mechanismy AI/ML – na datových tocích v reálném čase.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 9 Hlavní funkce řešení AI/ML v reálném čase v InterSystems IRIS

Praktický výsledek našeho prototypu:

  • Vzor defektu rozpoznaný modelem (12. ledna):

InterSystems IRIS - univerzální platforma AI/ML v reálném čase

  • Modelem rozpoznaná vyvíjející se závada, která nebyla součástí vzorku (11. září, samotnou závadu zjistil tým oprav až o dva dny později – 13. září):

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Simulace na reálných datech obsahujících několik epizod stejné závady ukázala, že naše řešení implementované na platformě InterSystems IRIS nám umožňuje detekovat vývoj závad tohoto typu několik dní předtím, než je detekuje tým oprav.

InterSystems IRIS - univerzální AI/ML výpočetní platforma v reálném čase

Platforma InterSystems IRIS zjednodušuje vývoj, nasazení a provoz datových řešení v reálném čase. InterSystems IRIS je schopen současně provádět transakční a analytické zpracování dat; udržovat synchronizované pohledy na data v souladu s několika modely (včetně relačních, hierarchických, objektových a dokumentových); fungovat jako integrační platforma pro širokou škálu datových zdrojů a jednotlivých aplikací; poskytují pokročilou analýzu strukturovaných a nestrukturovaných dat v reálném čase. InterSystems IRIS také poskytuje mechanismy pro použití externích analytických nástrojů, umožňuje flexibilitu kombinovat hosting v cloudu a na lokálních serverech.

Aplikace postavené na platformě InterSystems IRIS byly nasazeny napříč odvětvími a pomáhají společnostem dosáhnout významné ekonomické hodnoty ze strategického a provozního hlediska, zlepšují rozhodování a uzavírají mezery mezi událostí, analýzou a akcí.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 10 Architektura InterSystems IRIS v kontextu AI/ML v reálném čase

Stejně jako předchozí diagram kombinuje níže uvedený diagram nový „souřadnicový systém“ (CD/CI/CT) s tokem informací mezi pracovními položkami platformy. Vizualizace začíná makromechanismem CD a pokračuje makromechanismy CI a CT.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 11 Schéma informačních toků mezi prvky AI/ML platformy InterSystems IRIS

Podstata mechanismu CD v InterSystems IRIS: uživatelé platformy (vývojáři řešení AI / ML) přizpůsobují stávající a / nebo vytvářejí nové vývoje AI / ML pomocí specializovaného editoru kódu mechanismu AI / ML: Jupyter (celé jméno: Jupyter Notebook; také, pro stručnost se někdy nazývají dokumenty vytvořené v tomto editoru). V Jupyteru má vývojář možnost psát, ladit a ověřovat výkon (včetně použití grafiky) konkrétního vývoje AI / ML předtím, než je hostován („nasazen“) v InterSystems IRIS. Je jasné, že takto vytvořený nový vývoj dostane pouze základní ladění (jelikož zejména Jupyter nepracuje s datovými toky v reálném čase) - to je v pořádku, protože hlavním výsledkem vývoje v Jupyteru je potvrzením základní funkčnosti samostatného mechanismu AI / ML („ukazuje očekávaný výsledek na vzorku dat“). Podobně mechanismus již umístěný v platformě (viz následující makro-mechanismy) před laděním v Jupyteru může vyžadovat "rollback" do "pre-platformního" formuláře (čtení dat ze souborů, práce s daty přes xDBC místo tabulek, přímá interakce s globálními – multidimenzionální datová pole InterSystems IRIS – atd.).

Důležitým aspektem implementace CD v InterSystems IRIS je, že mezi platformou a Jupyter je implementována obousměrná integrace, která umožňuje přenášet na platformu (a dále zpracovávat v platformě) obsah v Pythonu, R a Julia (všechny tři jsou programovací jazyky v odpovídajících předních open-source zdrojových prostředích matematického modelování). Vývojáři obsahu AI/ML tak mají možnost „nepřetržitě nasazovat“ tento obsah na platformu, pracovat ve svém známém editoru Jupyter, se známými knihovnami dostupnými v Pythonu, R, Julia a provádět základní ladění (v případě potřeby) mimo platformu. .

Přejděme k makro mechanismu CI v InterSystems IRIS. Diagram ukazuje makroproces „robota v reálném čase“ (komplex datových struktur, obchodních procesů a fragmentů kódu jimi řízených v jazycích matů a v jazyce ObjectScript – nativním vývojovém jazyce InterSystems DUHOVKA). Úkolem tohoto makroprocesu je udržovat datové fronty nezbytné pro fungování mechanismů AI / ML (na základě datových toků přenášených na platformu v reálném čase), rozhodovat o sekvenci aplikace a „dosahu“ AI / ML mechanismy (jsou to také „matematické algoritmy“, „modely“ atd. - mohou být nazývány odlišně v závislosti na implementačních specifikách a terminologických preferencích), udržovat datové struktury aktuální pro analýzu výsledků práce mechanismů AI / ML (kostky, tabulky, vícerozměrná datová pole atd.) atd. - pro sestavy, dashboardy atd.).

Důležitým aspektem implementace CI v InterSystems IRIS je implementace obousměrné integrace mezi platformou a prostředím matematického modelování, což umožňuje spouštění obsahu hostovaného na platformě v Pythonu, R a Julia v jejich příslušných prostředích s návratem výsledků provádění. . Tato integrace je implementována jak v „terminálním režimu“ (tj. obsah AI/ML je formulován jako kód ObjectScript, který volá do mats), tak v „režimu obchodního procesu“ (tj. obsah AI/ML je formulován jako obchodní proces pomocí grafického editoru, nebo někdy pomocí Jupyter nebo pomocí IDE - IRIS Studio, Eclipse, Visual Studio Code). Editovatelnost obchodních procesů v Jupyter se odráží ve vztahu mezi IRIS na úrovni CI a Jupyter na úrovni CD. Podrobnější přehled integrace s prostředími matematického modelování je uveden níže. V této fázi jsou podle našeho názoru všechny důvody k tomu, abychom na platformě opravili přítomnost všech nezbytných nástrojů pro implementaci „nepřetržité integrace“ vývoje AI / ML (pocházející z „nepřetržitého zavádění“) do AI v reálném čase / ML řešení.

A hlavní makro mechanismus: CT. Bez ní nebude existovat žádná platforma AI / ML (ačkoli „reálný čas“ bude implementován prostřednictvím CD / CI). Podstatou CT je práce platformy s „artefakty“ strojového učení a umělé inteligence přímo v pracovních relacích prostředí matematického modelování: modely, distribuční tabulky, maticové vektory, vrstvy neuronových sítí atd. Tato „práce“ ve většině případů spočívá ve vytváření zmíněných artefaktů v prostředích (v případě modelů např. „tvorba“ spočívá v nastavení specifikace modelu a následném výběru hodnot jeho parametrů – tzv. tzv. „trénování“ modelu), jejich aplikace (u modelů: jejich použití k výpočtu „modelových“ hodnot cílových proměnných – prognózy, příslušnost do kategorie, pravděpodobnost výskytu události atd.) a zlepšení již vytvořené a aplikované artefakty (například předefinování množiny vstupních proměnných modelu na základě výsledků aplikace – za účelem zvýšení přesnosti predikce, volitelně). Klíčovým bodem pro pochopení role CT je jeho „abstrakce“ od reality CD a CI: CT bude implementovat všechny artefakty se zaměřením na výpočetní a matematická specifika řešení AI ​​/ML v rámci možností poskytovaných konkrétními prostředími. . Odpovědnost za „poskytnutí vstupních dat“ a „dodání výsledků“ bude mít na starosti CD a CI.

Důležitý aspekt implementace CT v InterSystems IRIS: pomocí integrace s matematickými modelovacími prostředími již zmíněnými výše má platforma schopnost extrahovat stejné artefakty z pracovních relací běžících pod její kontrolou v prostředích a (co je nejdůležitější) přeměnit je na platformu datové objekty. Například distribuční tabulku, která byla právě vytvořena v pracovní pythonské relaci, lze (bez zastavení relace v Pythonu) přenést na platformu například ve formě globálního (multidimenzionálního pole dat InterSystems IRIS) – a použít pro výpočty v jiném mechanismu AI / ML (již implementovaném v jazyce jiného prostředí - například v R) - nebo virtuální tabulce. Další příklad: souběžně s „normálním režimem“ provozu modelu (v pracovní relaci Pythonu) se na jeho vstupních datech provádí „auto-ML“: automatický výběr optimálních vstupních proměnných a hodnot parametrů. A spolu s „běžným“ školením dostává produktivní model v reálném čase také „návrh optimalizace“ pro jeho specifikaci – ve kterém se mění sada vstupních proměnných, mění se hodnoty parametrů (ne v důsledku školení v Pythonu , ale v důsledku trénování „alternativní verze sebe sama, například v H2O stacku), což umožňuje celkovému řešení AI/ML autonomně se vyrovnat s nepředvídanými změnami v povaze vstupních dat a modelovaných jevů.

Pojďme se podrobněji seznámit s funkčností platformy AI / ML InterSystems IRIS na příkladu reálného prototypu.

V níže uvedeném diagramu je na levé straně snímku část obchodního procesu, který implementuje zpracování skriptů v Pythonu a R. V centrální části jsou vizuální protokoly pro provádění některých z těchto skriptů, respektive v Pythonu a R. Hned za nimi jsou příklady obsahu v jednom a dalším jazyce, které byly odeslány ke spuštění ve vhodných prostředích. Na konci vpravo jsou vizualizace založené na výsledcích provádění skriptu. Vizualizace nahoře jsou vytvořeny na IRIS Analytics (data jsou přebírána z Pythonu do datové platformy InterSystems IRIS a zobrazována na řídicím panelu pomocí platformy), dole jsou vytvářeny přímo v pracovní relaci R a odtud výstup do grafické soubory. Důležitý aspekt: ​​prezentovaný fragment v prototypu je zodpovědný za trénování modelu (klasifikace stavů zařízení) na datech přicházejících v reálném čase z procesního simulátoru zařízení, na příkaz procesního monitoru kvality klasifikace pozorované během aplikace modelu. Dále bude diskutována implementace řešení AI/ML jako souboru vzájemně se ovlivňujících procesů („agentů“).

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 12 Interakce s Pythonem, R a Julia v InterSystems IRIS

Procesy platformy (jsou to také „obchodní procesy“, „analytické procesy“, „potrubí“ atd. - v závislosti na kontextu) se primárně upravují v grafickém editoru podnikových procesů v samotné platformě, a to tak, že oba jeho blokové schéma a odpovídající mechanismus AI/ML (programový kód) jsou vytvořeny současně. Když mluvíme o skutečnosti, že „je získán mechanismus AI / ML“, máme na začátku na mysli hybriditu (v rámci stejného procesu): obsah v jazycích prostředí matematického modelování sousedí s obsahem v SQL (včetně rozšíření z IntegratedML), v InterSystems ObjectScript, s dalšími podporovanými jazyky. Platformový proces navíc poskytuje velmi široké možnosti pro „kreslení“ ve formě hierarchicky vnořených fragmentů (jak je vidět na příkladu na obrázku níže), což umožňuje efektivně organizovat i velmi složitý obsah, aniž by „vypadl“ grafický formát kdekoli (do „negrafických » metod/tříd/postupů atd.). To znamená, že v případě potřeby (a očekává se to u většiny projektů) lze implementovat absolutně všechna řešení AI / ML v grafickém formátu s vlastním komentářem. Vezměte prosím na vědomí, že v centrální části níže uvedeného diagramu, která ukazuje vyšší „úroveň vnoření“, můžete vidět, že kromě samotné práce na trénování modelu (pomocí Pythonu a R) probíhá analýza tzv. ROC je přidána křivka trénovaného modelu, která umožňuje vizuálně (a také výpočetně) vyhodnotit kvalitu trénování - a tato analýza je implementována v jazyce Julia (provádí se resp. v prostředí Julia).

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 13 Vizuální prostředí pro skládání řešení AI/ML v InterSystems IRIS

Jak již bylo zmíněno dříve, počáteční vývoj a (v některých případech) přizpůsobení mechanismů AI / ML již implementovaných v platformě bude / lze provést mimo platformu v editoru Jupyter. V níže uvedeném diagramu vidíme příklad přizpůsobení existujícího procesu platformy (stejný jako v diagramu výše) - takto vypadá fragment, který je zodpovědný za trénování modelu v Jupyter. Obsah Pythonu je k dispozici pro úpravy, ladění, grafický výstup přímo v Jupyteru. Změny (v případě potřeby) lze provádět s okamžitou synchronizací s procesem platformy, včetně její produkční verze. Podobně lze na platformu přenést nový obsah (automaticky se vygeneruje nový proces platformy).

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 14 Použití Jupyter Notebooku k úpravě AI/ML Engine v InterSystems IRIS Platform

Přizpůsobení procesu platformy lze provádět nejen v grafickém nebo notebookovém formátu, ale také ve formátu „total“ IDE (Integrated Development Environment). Těmito IDE jsou IRIS Studio (nativní IRIS studio), Visual Studio Code (InterSystems rozšíření IRIS pro VSCode) a Eclipse (Atelier plugin). V některých případech je možné, aby vývojový tým používal všechna tři IDE současně. Níže uvedený diagram ukazuje příklad úprav stejného procesu v IRIS studiu, Visual Studio Code a Eclipse. Absolutně veškerý obsah je k dispozici pro úpravy: Python / R / Julia / SQL a ObjectScript a obchodní proces.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 15 Vývoj obchodního procesu InterSystems IRIS v různých IDE

Zvláštní zmínku si zaslouží nástroje pro popis a provádění obchodních procesů InterSystems IRIS v jazyce Business Process Language (BPL). BPL umožňuje používat „hotové integrační komponenty“ (aktivity) v obchodních procesech – což ve skutečnosti dává plný důvod k tvrzení, že „nepřetržitá integrace“ je implementována v InterSystems IRIS. Hotové komponenty podnikových procesů (aktivity a vazby mezi nimi) jsou nejvýkonnějším akcelerátorem pro sestavení řešení AI/ML. A nejen sestavy: díky činnostem a propojením mezi nimi, přes nesourodý vývoj a mechanismy AI / ML se objevuje „vrstva autonomního řízení“, která je schopna se rozhodovat podle situace v reálném čase.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 16 Hotové komponenty podnikových procesů pro kontinuální integraci (CI) na platformě InterSystems IRIS

Koncept agentních systémů (jedná se také o „multi-agentní systémy“) má v robotice silné postavení a platforma InterSystems IRIS jej organicky podporuje prostřednictvím konstruktu „produkt-proces“. Kromě neomezených možností „nacpat“ každý proces funkcionalitou nutnou pro celkové řešení, umožňuje vybavit systém platformových procesů vlastností „agentury“ vytvářet efektivní řešení pro extrémně nestabilní simulované jevy (chování sociálních/biosystémů). , částečně pozorovatelné technologické procesy apod.).

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 16 Provoz řešení AI/ML jako systému business process agent v InterSystems IRIS

Pokračujeme v recenzi InterSystems IRIS příběhem o aplikaci platformy pro řešení celých tříd problémů v reálném čase (poměrně podrobné seznámení s některými osvědčenými postupy platformy AI / ML na InterSystems IRIS se vyskytuje v jednom z našich předchozích webináře).

Při honbě za předchozím diagramem je níže podrobnější diagram systému agentů. Diagram ukazuje stejný prototyp, všechny čtyři procesy agenta jsou viditelné, vztahy mezi nimi jsou schematicky nakresleny: GENERATOR - zajišťuje vytváření dat pomocí senzorů zařízení, BUFFER - spravuje datové fronty, ANALYZER - provádí samotné strojové učení, MONITOR - řídí kvalita strojového učení a dává signál, že je potřeba model přeškolit.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 17 Složení řešení AI/ML jako systému business process agent v InterSystems IRIS

Níže uvedený diagram ilustruje autonomní fungování jiného robotického prototypu (rozpoznávání emočního textu) po určitou dobu. V horní části - vývoj indikátoru kvality učení modelu (kvalita roste), v dolní části - dynamika indikátoru kvality modelové aplikace a skutečnosti opakovaného školení (červené pruhy). Jak vidíte, řešení se efektivně a autonomně samo naučilo a funguje na dané úrovni kvality (hodnoty indikátoru kvality neklesají pod 80 %).

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 18 Kontinuální (samo)učení (CT) na platformě InterSystems IRIS

Již dříve jsme také zmínili „auto-ML“, ale níže uvedený diagram ukazuje aplikaci této funkce podrobně na příkladu jiného prototypu. Grafický diagram fragmentu obchodního procesu ukazuje aktivitu, která spouští simulaci v zásobníku H2O, ukazuje výsledky této simulace (zřejmá dominance výsledného modelu nad „umělými“ modely, dle srovnávacího diagramu ROC křivek , stejně jako automatizovaná identifikace „nejvlivnějších proměnných“ z těch, které jsou k dispozici v původním souboru dat). Důležitým bodem je zde úspora času a odborných zdrojů, kterých je dosaženo prostřednictvím „auto-ML“: to, co proces naší platformy udělá za půl minuty (nalezení a zaškolení optimálního modelu), může expertovi zabrat týden až Měsíc.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 19 Integrace Auto-ML do řešení AI/ML založeného na platformě InterSystems IRIS

Níže uvedený diagram trochu „zničí vyvrcholení“, ale je to dobrý způsob, jak dokončit příběh o třídách problémů v reálném čase, které se řeší: připomínáme, že se všemi možnostmi platformy InterSystems IRIS jsou tréninkové modely pod jeho kontrola není povinná. Platforma může externě získat tzv. specifikaci modelu PMML vyškolenou v nástroji, který platforma neřídí – a tento model aplikovat v reálném čase od okamžiku jeho importu Specifikace PMML. Zároveň je důležité vzít v úvahu, že ne všechny AI / ML artefakty lze zredukovat na PMML specifikaci, i když to většina nejběžnějších artefaktů umožňuje. Platforma InterSystems IRIS má tedy „otevřenou smyčku“ a pro uživatele neznamená „otroctví platformy“.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 20 Integrace Auto-ML do řešení AI/ML založeného na platformě InterSystems IRIS

Uvádíme další výhody platformy InterSystems IRIS (pro přehlednost ve vztahu k řízení procesů), které mají velký význam při automatizaci umělé inteligence a strojovém učení v reálném čase:

  • Pokročilé integrační nástroje s libovolnými datovými zdroji a spotřebiteli (PCS/SCADA, zařízení, MRO, ERP atd.)
  • Vestavěný vícemodelové DBMS pro vysoce výkonné transačně-analytické zpracování (Hybrid Transaction/Analytical Processing, HTAP) jakýchkoli objemů procesních dat
  • Vývojové nástroje pro nepřetržité nasazení rozhodovacích enginů AI/ML v reálném čase založených na Pythonu, R, Julia
  • Adaptivní obchodní procesy pro nepřetržitou integraci a mechanismy (samo)učení řešení AI/ML v reálném čase
  • Vestavěné nástroje Business Intelligence pro vizualizaci procesních dat a výsledků řešení AI/ML
  • Správa API dodávat výsledky řešení AI ​​/ML do systémů řízení procesů / SCADA, informačních a analytických systémů, zasílání výstrah atd.

Řešení AI / ML založená na platformě InterSystems IRIS snadno zapadají do stávající IT infrastruktury. Platforma InterSystems IRIS poskytuje vysokou spolehlivost řešení AI/ML prostřednictvím podpory konfigurací odolných proti chybám a katastrofám a flexibilního nasazení ve virtuálních prostředích, na fyzických serverech, v privátních a veřejných cloudech, kontejnerech Docker.

InterSystems IRIS je tedy univerzální výpočetní platforma AI/ML v reálném čase. Univerzalitu naší platformy v praxi potvrzuje absence de facto omezení složitosti implementovaných výpočtů, schopnost InterSystems IRIS kombinovat (v reálném čase) zpracování scénářů z široké škály průmyslových odvětví a mimořádná přizpůsobivost všech funkcí a mechanismů platformy podle konkrétních potřeb uživatelů.

InterSystems IRIS - univerzální platforma AI/ML v reálném čase
Obrázek 21 InterSystems IRIS – Universal Real-time AI/ML Computing Platform

Pro věcnější interakci s těmi z našich čtenářů, kteří se zajímají o zde prezentovaný materiál, doporučujeme, abyste se neomezovali na jeho čtení a pokračovali v dialogu „živě“. Rádi poskytneme podporu s formulací scénářů AI / ML v reálném čase ve vztahu ke specifikům vaší společnosti, provedeme společné prototypování na platformě InterSystems IRIS, vytvoříme a uvedeme do praxe cestovní mapu pro zavádění umělé inteligence a strojového učení do vašich výrobních a řídících procesů. Kontaktní e-mailová adresa naší expertní skupiny AI/ML je [chráněno e-mailem].

Zdroj: www.habr.com

Přidat komentář