InterSystems IRIS - универсална AI/ML платформа в реално време

Автор: Сергей Лукянчиков, инженер-консултант в InterSystems

AI/ML компютърни повиквания в реално време

Нека започнем с примери от практиката на Data Science в InterSystems:

  • Зареденият портал за купувачи е свързан с онлайн система за препоръки. Ще има преструктуриране на промоциите в търговската мрежа (например, вместо „плоска“ линия от промоции, сега ще се използва матрица „сегментна тактика“). Какво се случва с двигателите за препоръки? Какво се случва с подаването и актуализирането на данни към системата за препоръки (обемът на въведените данни се е увеличил 25000 XNUMX пъти)? Какво се случва с разработването на препоръки (необходимостта от намаляване на прага на филтриране на правилата за препоръки с хиляда пъти поради хилядократно увеличаване на техния брой и „обхват“)?
  • Има система за наблюдение на вероятността от развитие на дефекти в компонентите на оборудването. Към системата за мониторинг беше свързана автоматизирана система за управление на процесите, която всяка секунда предава хиляди параметри на технологичните процеси. Какво се случва със системата за мониторинг, която преди това е работила върху „ръчни проби“ (способна ли е да осигури мониторинг на вероятността секунда по секунда)? Какво ще се случи, ако във входните данни се появи нов блок от няколкостотин колони с показания от сензори, наскоро добавени към системата за контрол на процеса (ще бъде ли необходимо и за колко време да спре системата за мониторинг, за да включи данни от нови сензори в анализа )?
  • Създаден е набор от AI/ML механизми (препоръка, мониторинг, прогнозиране), които използват резултатите от работата на другия. Колко човекочаса са необходими всеки месец, за да се адаптира работата на този комплекс към промените във входните данни? Какво е общото „забавяне“, когато се поддържа от комплекса за вземане на управленски решения (честотата на поява на нова поддържаща информация в него спрямо честотата на поява на нови входни данни)?

Обобщавайки тези и много други примери, стигнахме до формулирането на предизвикателствата, които възникват при преминаването към използването на механизми за машинно обучение и изкуствен интелект в реално време:

  • Доволни ли сме от скоростта на създаване и адаптиране (към променящата се ситуация) на разработките на AI/ML в нашата компания?
  • Доколко използваните от нас AI/ML решения поддържат бизнес управление в реално време?
  • Решенията за AI/ML, които използваме, могат ли самостоятелно (без разработчици) да се адаптират към промените в практиките за управление на данни и бизнес?

Нашата статия е задълбочен преглед на възможностите на платформата InterSystems IRIS по отношение на универсална поддръжка за внедряване на AI/ML механизми, сглобяване (интегриране) на AI/ML решения и обучение (тестване) на AI/ML решения на интензивни потоци от данни. В тази статия ще разгледаме пазарни проучвания, казуси от AI/ML решения и концептуални аспекти на това, което наричаме AI/ML платформа в реално време.

Какво знаем от проучвания: приложения в реално време

резултати изследванепроведено сред близо 800 ИТ специалисти през 2019 г. от Lightbend, говорят сами за себе си:

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 1 Водещи потребители на данни в реално време

Нека цитираме важни фрагменти от доклада за резултатите от това проучване в наш превод:

„... Тенденциите в популярността на инструменти за интегриране на потоци от данни и в същото време поддържане на изчисления в контейнери осигуряват синергичен отговор на искането на пазара за по-отзивчиво, рационално, динамично предложение за ефективни решения. Поточното предаване на данни прехвърля информация по-бързо от традиционните пакети данни. Към това се добавя способността за бързо прилагане на изчислителни методи, като например препоръки, базирани на AI/ML, създавайки конкурентни предимства чрез повишена удовлетвореност на клиентите. Надпреварата за гъвкавост също оказва влияние върху всички роли в парадигмата на DevOps - правейки разработката и внедряването на приложения по-ефективни. … Осемстотин и четирима ИТ специалисти предоставиха информация за използването на потоци от данни в техните организации. Анкетираните се намират предимно в западни страни (41% в Европа и 37% в Северна Америка) и са почти равномерно разпределени между малки, средни и големи компании. ...

... Изкуственият интелект не е реклама. Петдесет и осем процента от тези, които вече използват обработка на поток от данни в продуктивни AI/ML приложения, потвърждават, че тяхното използване на AI/ML ще отбележи най-голям ръст през следващата година (в сравнение с други приложения).

  • Според мнозинството от респондентите използването на потоци от данни в сценарии за AI/ML ще отбележи най-голям ръст през следващата година.
  • Приложенията в AI/ML ще растат не само поради сравнително нови типове сценарии, но и поради традиционните сценарии, в които все повече се използват данни в реално време.
  • В допълнение към AI/ML, нивото на ентусиазъм сред потребителите на IoT канали за данни е впечатляващо – 48% от тези, които вече са интегрирали IoT данни, казват, че внедряването на сценарий върху тези данни ще се увеличи значително в близко бъдеще. ..."

От това доста интересно проучване става ясно, че възприемането на сценариите за машинно обучение и изкуствен интелект като лидери в потреблението на потоци от данни вече е „на път“. Но също толкова важно наблюдение е възприемането на AI/ML в реално време през призмата на DevOps: тук вече можем да започнем да говорим за трансформацията на все още доминиращата култура на „AI/ML за еднократна употреба с напълно достъпен набор от данни“.

Концепция на платформата AI/ML в реално време

Една типична област на приложение на AI/ML в реално време е контролът на процесите в производството. Използвайки нейния пример и вземайки предвид предишни мисли, ще формулираме концепцията за AI/ML платформа в реално време.
Използването на изкуствен интелект и машинно обучение в управлението на процеси има редица характеристики:

  • Данните за състоянието на технологичния процес се получават интензивно: с висока честота и за широк диапазон от параметри (до десетки хиляди стойности на параметри, предавани в секунда от системата за управление на процеса)
  • Данните за идентифициране на дефекти, да не говорим за данните за тяхното развитие, напротив, са оскъдни и нередовни, характеризиращи се с недостатъчна типизация на дефектите и тяхното локализиране във времето (често представени от хартиени записи)
  • От практическа гледна точка е наличен само „прозорец на релевантност“ на изходните данни за обучение и прилагане на модели, отразяващи динамиката на технологичния процес през разумен плъзгащ се интервал, завършващ с последните прочетени стойности на параметрите на процеса

Тези функции ни принуждават, в допълнение към получаването и основната обработка в реално време на интензивния „широколентов входен сигнал“ от технологичния процес, да извършваме (паралелно) прилагането, обучението и контрола на качеството на резултатите от AI ​​/ ML модели - също в реално време. „Рамката“, която нашите модели „виждат“ в плъзгащия се прозорец на релевантност, непрекъснато се променя – и с това се променя и качеството на резултатите от работата на AI/ML моделите, обучени на една от „рамките“ в миналото . Ако качеството на резултатите от работата на AI/ML моделите се влоши (например: стойността на класификационната грешка „аларма-норма“ е надхвърлила границите, които сме дефинирали), трябва автоматично да се стартира допълнително обучение на моделите на по-актуална „рамка“ - и изборът на момент за стартиране на допълнително обучение на моделите трябва да вземе предвид как продължителността на самото обучение, така и динамиката на влошаване на качеството на работа на текущата версия на моделите (тъй като текущите версии на моделите продължават да се използват, докато моделите се обучават и докато се формират техните „новообучени“ версии).

InterSystems IRIS има ключови платформени възможности за активиране на AI/ML решения за контрол на процеси в реално време. Тези способности могат да бъдат разделени на три основни групи:

  • Непрекъснато внедряване (Continuous Deployment/Delivery, CD) на нови или адаптирани съществуващи AI/ML механизми в продуктивно решение, работещо в реално време на платформата InterSystems IRIS
  • Непрекъсната интеграция (CI) в едно продуктивно решение на входящи потоци от данни за технологични процеси, опашки от данни за приложение/обучение/контрол на качеството на AI/ML механизми и обмен на данни/код/контролни действия със среди за математическо моделиране, оркестрирани в реално време платформа InterSystems IRIS
  • Непрекъснато (само)обучение (Continuous Training, CT) на механизми AI/ML, извършвано в среди за математическо моделиране, използващи данни, код и контролни действия („взети решения“), предавани от платформата InterSystems IRIS

Класификацията на възможностите на платформата във връзка с машинното обучение и изкуствения интелект в точно тези групи не е случайна. Нека цитираме методологията публикация Google, който предоставя концептуална основа за тази класификация, в нашия превод:

„... Концепцията DevOps, популярна в наши дни, обхваща разработването и експлоатацията на широкомащабни информационни системи. Предимствата на прилагането на тази концепция са намаляване на продължителността на циклите на разработка, по-бързо разгръщане на разработките и гъвкавост при планирането на версиите. За да постигне тези предимства, DevOps включва прилагането на поне две практики:

  • Непрекъсната интеграция (CI)
  • Непрекъсната доставка (CD)

Тези практики се прилагат и за AI/ML платформи, за да се гарантира надеждно и ефективно сглобяване на продуктивни AI/ML решения.

AI/ML платформите се различават от другите информационни системи в следните аспекти:

  • Екипни компетенции: Когато създава AI/ML решение, екипът обикновено включва учени по данни или „академични“ експерти в областта на изследването на данни, които извършват анализ на данни, разработват и тестват модели. Тези членове на екипа може да не са професионални разработчици на продуктивен код.
  • Разработка: AI/ML двигателите са експериментални по природа. За да се реши даден проблем по най-ефективния начин, е необходимо да се премине през различни комбинации от входни променливи, алгоритми, методи за моделиране и параметри на модела. Сложността на такова търсене се състои в проследяването на „какво работи/не работи“, осигуряване на възпроизводимост на епизодите, обобщаване на разработките за повторни реализации.
  • Тестване: Тестването на AI/ML двигатели изисква по-широк набор от тестове, отколкото повечето други разработки. В допълнение към стандартните единични и интеграционни тестове се тества валидността на данните и качеството на резултатите от прилагането на модела към обучителни и контролни проби.
  • Внедряване: Внедряването на AI/ML решения не се ограничава до предсказуеми услуги, които използват веднъж обучен модел. Решенията AI/ML са изградени около многоетапни конвейери, които извършват автоматизирано обучение и приложение на модели. Разполагането на такива тръбопроводи включва автоматизиране на нетривиални действия, традиционно извършвани ръчно от специалисти по данни, за да могат да обучават и тестват модели.
  • Производителност: AI/ML двигателите може да имат липса на производителност не само поради неефективно програмиране, но и поради постоянно променящия се характер на входните данни. С други думи, производителността на AI/ML механизмите може да се влоши поради по-широк кръг от причини, отколкото производителността на конвенционалните разработки. Което води до необходимостта да наблюдаваме (онлайн) ефективността на нашите AI/ML машини, както и да изпращаме предупреждения или да отхвърляме резултати, ако показателите за ефективност не отговарят на очакванията.

Платформите AI/ML са подобни на други информационни системи, тъй като и двете изискват непрекъсната интеграция на код с контрол на версиите, тестване на единици, тестване за интеграция и непрекъснато внедряване на разработки. Въпреки това, в случая на AI/ML има няколко важни разлики:

  • CI (непрекъсната интеграция) вече не се ограничава до тестване и валидиране на кода на внедрените компоненти – той също така включва тестване и валидиране на данни и AI/ML модели.
  • CD (Continuous Delivery/Deployment, непрекъснато внедряване) не се ограничава до писане и пускане на пакети или услуги, но предполага платформа за съставяне, обучение и прилагане на AI/ML решения.
  • CT (Continuous Training, непрекъснато обучение) е нов елемент [прибл. автор на статията: нов елемент във връзка с традиционната концепция на DevOps, в която CT е по правило Continuous Testing], присъща на AI/ML платформите, отговорни за автономното управление на механизмите за обучение и прилагане на AI /ML модели. ..."

Можем да заявим, че машинното обучение и изкуственият интелект, работещи с данни в реално време, изискват по-широк набор от инструменти и компетенции (от разработване на код до оркестрация на среди за математическо моделиране), по-тясна интеграция между всички функционални и предметни области, по-ефективна организация на човешките и машинни ресурси.

Сценарий в реално време: разпознаване на развитието на дефекти в захранващите помпи

Продължавайки да използваме зоната за контрол на процеса като пример, помислете за конкретен проблем (вече споменахме в самото начало): трябва да осигурим мониторинг в реално време на развитието на дефекти в помпите въз основа на потока от стойности на параметрите на процеса ​​и доклади от ремонтния персонал за идентифицирани дефекти.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 2 Формулиране на проблема за наблюдение на развитието на дефекти

Характеристика на повечето задачи, поставени по този начин в практиката, е, че редовността и ефективността на получаване на данни (APCS) трябва да се разглеждат на фона на епизодичното и нерегулярно възникване (и регистриране) на дефекти от различен тип. С други думи: данните от системата за контрол на процесите пристигат веднъж в секунда, коректни и точни, а бележките за дефектите се правят с химичен молив с посочване на датата в обща тетрадка в сервиза (например: „12.01 – теч в капака от страната на 3-тия лагер”).

По този начин можем да допълним формулировката на проблема със следното важно ограничение: имаме само един „етикет“ на дефект от конкретен тип (т.е. пример за дефект от конкретен тип е представен от данни от контрола на процеса система на определена дата - и нямаме повече примери за дефект от този конкретен тип). Това ограничение незабавно ни извежда извън обхвата на класическото машинно обучение (контролирано обучение), за което трябва да има много „тагове“.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 3 Изясняване на задачата за наблюдение на развитието на дефекти

Можем ли по някакъв начин да „умножим“ единствения „етикет“, с който разполагаме? Да, можем. Текущото състояние на помпата се характеризира със степента на сходство с регистрираните дефекти. Дори и без използването на количествени методи, на ниво визуално възприятие, като наблюдавате динамиката на стойностите на данните, пристигащи от системата за управление на процеса, вече можете да научите много:

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 4 Динамика на състоянието на помпата на фона на „маркировка“ на дефект от даден тип

Но визуалното възприятие (поне засега) не е най-подходящият генератор на „тагове“ в нашия бързо променящ се сценарий. Ние ще оценим сходството на текущото състояние на помпата с докладваните дефекти, като използваме статистически тест.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 5 Прилагане на статистически тест към входящи данни на фона на „етикет“ за дефект

Статистически тест определя вероятността записите със стойностите на параметрите на технологичния процес в „поточния пакет“, получен от системата за управление на процеса, да са подобни на записите на „етикета“ на дефект от определен тип. Стойността на вероятността (статистически индекс на сходство), изчислена в резултат на прилагане на статистически тест, се преобразува в стойност 0 или 1, превръщайки се в „етикет“ за машинно обучение във всеки конкретен запис в пакета, който се изследва за сходство. Тоест, след обработка на новополучен пакет от записи на състоянието на помпата със статистически тест, имаме възможност да (а) добавим този пакет към набора за обучение за обучение на модела AI/ML и (б) да извършим контрол на качеството на текущата версия на модела, когато го използвате към този пакет.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 6 Прилагане на модел на машинно обучение към входящи данни на фона на „етикет“ за дефект

В един от предишните ни уеб семинари Ние показваме и обясняваме как платформата InterSystems IRIS ви позволява да внедрите всеки AI/ML механизъм под формата на непрекъснато изпълняващи се бизнес процеси, които наблюдават надеждността на резултатите от моделирането и адаптират параметрите на модела. Когато внедряваме прототип на нашия сценарий с помпи, ние използваме цялата функционалност на InterSystems IRIS, представена по време на уебинара - внедрявайки в процеса на анализатора като част от нашето решение не класическо контролирано обучение, а по-скоро обучение с подсилване, което автоматично управлява селекцията за модели на обучение . Обучителната извадка съдържа записи, върху които възниква „консенсус за откриване“ след прилагане както на статистическия тест, така и на текущата версия на модела – т.е. на такива записи 0. При ново обучение на модела, по време на неговото валидиране (новообученият модел се прилага към собствена обучителна извадка, с предварително прилагане на статистически тест към него), записва, че „не е запазил“ резултат 1 след обработката чрез статистическия тест (поради постоянното присъствие в обучението извадка от записи от оригиналния „етикет“ на дефекта), се премахват от набора за обучение и нова версия на модела се учи от „етикета“ на дефект плюс „запазените“ записи от потока.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 7 Роботизация на AI/ML изчисления в InterSystems IRIS

Ако има нужда от вид „второ мнение“ относно качеството на откриване, получено по време на локални изчисления в InterSystems IRIS, се създава процес на съветник за извършване на обучение и прилагане на модели върху контролен набор от данни с помощта на облачни услуги (например Microsoft Azure, Amazon Web Services, Google Cloud Platform и др.):

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 8 Второ мнение от Microsoft Azure, организирано от InterSystems IRIS

Прототипът на нашия сценарий в InterSystems IRIS е проектиран като базирана на агент система от аналитични процеси, които взаимодействат с обект на оборудване (помпа), среди за математическо моделиране (Python, R и Julia) и осигуряват самообучение на всички включени AI/ ML механизми - на потоци от данни в реално време.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 9 Основна функционалност на решението AI/ML в реално време в InterSystems IRIS

Практическият резултат от нашия прототип:

  • Примерен дефект, разпознат от модела (12 януари):

InterSystems IRIS - универсална AI/ML платформа в реално време

  • Развиващ се дефект, разпознат от модела, който не е включен в извадката (11 септември, самият дефект е идентифициран от ремонтния екип само два дни по-късно, на 13 септември):

InterSystems IRIS - универсална AI/ML платформа в реално време
Симулацията върху реални данни, съдържащи няколко епизода на един и същ дефект, показа, че нашето решение, внедрено на платформата InterSystems IRIS, ни позволява да идентифицираме развитието на дефекти от този тип няколко дни преди те да бъдат открити от ремонтния екип.

InterSystems IRIS - универсална AI/ML изчислителна платформа в реално време

Платформата InterSystems IRIS опростява разработването, внедряването и работата на решения за данни в реално време. InterSystems IRIS е в състояние едновременно да извършва транзакционна и аналитична обработка на данни; поддържат синхронизирани изгледи на данни според множество модели (включително релационни, йерархични, обектни и документни); действа като платформа за интегриране на широк набор от източници на данни и отделни приложения; предоставят усъвършенствани анализи в реално време на структурирани и неструктурирани данни. InterSystems IRIS предоставя и механизми за използване на външни аналитични инструменти и позволява гъвкаво комбиниране на хостинг в облака и на локални сървъри.

Приложенията, изградени върху платформата InterSystems IRIS, са разгърнати в различни индустрии, като помагат на компаниите да реализират значителни икономически ползи от стратегическа и оперативна гледна точка, увеличавайки вземането на информирани решения и преодолявайки празнините между събитие, анализ и действие.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 10 Архитектура на InterSystems IRIS в контекста на AI/ML в реално време

Подобно на предишната диаграма, диаграмата по-долу съчетава новата „координатна система“ (CD/CI/CT) с диаграма на потока от информация между работните елементи на платформата. Визуализацията започва с макромеханизма CD и продължава с макромеханизмите CI и CT.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 11 Диаграма на информационните потоци между AI/ML елементи на платформата InterSystems IRIS

Същността на CD механизма в InterSystems IRIS: потребителите на платформа (разработчици на AI/ML решения) адаптират съществуващи и/или създават нови AI/ML разработки, използвайки специализиран кодов редактор за AI/ML механизми: Jupyter (пълно име: Jupyter Notebook; за краткост документите, създадени в този редактор, също понякога се наричат). В Jupyter разработчикът има възможност да пише, отстранява грешки и проверява производителността (включително използване на графики) на конкретна AI/ML разработка, преди да бъде поставена („разгърната“) в InterSystems IRIS. Ясно е, че нова разработка, създадена по този начин, ще получи само основно отстраняване на грешки (тъй като по-специално Jupyter не работи с потоци от данни в реално време) - това е в реда на нещата, защото основният резултат от разработката в Jupyter е потвърждение за фундаменталната работоспособност на отделен AI / ML механизъм („показва очаквания резултат върху извадка от данни“). По подобен начин механизъм, който вече е поставен в платформата (вижте следните макромеханизми) преди отстраняване на грешки в Jupyter, може да изисква „връщане назад“ към „предплатформена“ форма (четене на данни от файлове, работа с данни чрез xDBC вместо таблици, директно взаимодействие с глобали - многомерни масиви от данни InterSystems IRIS – и др.).

Важен аспект на внедряването на CD в InterSystems IRIS: двупосочна интеграция е внедрена между платформата и Jupyter, позволявайки съдържание в Python, R и Julia да бъде прехвърлено към платформата (и впоследствие обработено в платформата) (и трите са програмни езици в съответните водещи езици с отворен код).изходни среди за математическо моделиране). По този начин разработчиците на AI/ML съдържание имат възможността да извършат „непрекъснато внедряване“ на това съдържание в платформата, работейки в техния познат Jupyter редактор, с познати библиотеки, налични в Python, R, Julia, и извършвайки основно отстраняване на грешки (ако е необходимо) извън платформата.

Нека да преминем към CI макро механизма в InterSystems IRIS. Диаграмата показва макропроцеса на „роботизатора в реално време“ (комплекс от структури от данни, бизнес процеси и кодови фрагменти, оркестрирани от тях на математически езици и ObjectScript - родния език за разработка на InterSystems IRIS). Задачата на този макро процес е да поддържа опашките от данни, необходими за работата на AI/ML механизмите (на базата на потоци от данни, предавани на платформата в реално време), да взема решения относно последователността на прилагане и „асортимента“ на AI/ ML механизмите (те са още „математически алгоритми“, „модели“ и др. – могат да се наричат ​​по различен начин в зависимост от спецификата на имплементацията и терминологичните предпочитания), поддържат структурите от данни актуални за анализ на резултатите от работата на AI/ ML механизми (кубове, таблици, многомерни масиви от данни и др.) и др. – за отчети, табла за управление и др.).

Важен аспект от внедряването на CI в InterSystems IRIS: въведена е двупосочна интеграция между платформата и средите за математическо моделиране, което ви позволява да изпълнявате съдържание, хоствано в платформата, в Python, R и Julia в съответните им среди и да получавате обратно резултатите от изпълнението. Тази интеграция е реализирана както в „терминален режим“ (т.е. AI/ML съдържанието е формулирано като ObjectScript код, който прави повиквания към средата), така и в „режим на бизнес процес“ (т.е. AI/ML съдържанието е формулирано като бизнес процес с помощта на графичен редактор или понякога с помощта на Jupyter или с помощта на IDE - IRIS Studio, Eclipse, Visual Studio Code). Наличието на бизнес процеси за редактиране в Jupyter се отразява чрез връзката между IRIS на ниво CI и Jupyter на ниво CD. По-подробен преглед на интеграцията със среди за математическо моделиране е даден по-долу. На този етап, по наше мнение, има всички основания да се гарантира, че платформата разполага с всички необходими инструменти за внедряване на „непрекъсната интеграция“ на разработки на AI/ML (идващи от „непрекъснато внедряване“) в AI/ML решения в реално време.

И основният макро механизъм: CT. Без него няма да има AI/ML платформа (въпреки че „в реално време“ ще се реализира чрез CD/CI). Същността на CT е работата на платформата с „артефакти“ на машинно обучение и изкуствен интелект директно в работни сесии на среди за математическо моделиране: модели, таблици за разпределение, матрични вектори, слоеве от невронни мрежи и др. Тази „работа“ в повечето случаи се състои в създаване на споменатите артефакти в среди (в случай на модели, например, „създаване“ се състои в задаване на спецификацията на модела и последващ избор на стойностите на неговите параметри - така нареченото „обучение“ на модела), тяхното приложение (за модели: изчисляване с тяхна помощ на „моделни“ стойности на целеви променливи - прогнози, принадлежност към категория, вероятност за събитие и др.) и подобряване на вече създадени и приложени артефакти (например, предефиниране на набор от входни променливи на модел въз основа на резултатите от приложението - с цел подобряване на точността на прогнозиране, като опция). Ключовият момент в разбирането на ролята на CT е неговата „абстракция“ от реалностите на CD и CI: CT ще внедри всички артефакти, като се фокусира върху изчислителните и математически специфики на AI/ML решението в рамките на възможностите, предоставени от специфични среди. Отговорността за „осигуряване на входове“ и „доставяне на резултати“ ще бъде отговорност на CD и CI.

Важен аспект от внедряването на CT специално в InterSystems IRIS: използвайки вече споменатата по-горе интеграция със среди за математическо моделиране, платформата има способността да извлича тези артефакти от работни сесии, изпълнявани под неин контрол в математически среди и (най-важното) да преобразува ги в обекти с данни на платформата. Например таблица за разпределение, която току-що е създадена в работеща сесия на Python, може да бъде (без да спира сесията на Python) прехвърлена към платформата под формата например на глобална (многоизмерен масив от данни на InterSystems IRIS) - и използвана за изчисления в друг механизъм AI/ML (имплементиран на езика на друга среда - например в R) - или виртуална таблица. Друг пример: успоредно с „нормалния режим“ на работа на модела (в работната сесия на Python), „auto-ML“ се извършва върху неговите входни данни: автоматичен избор на оптимални входни променливи и стойности на параметри. И заедно с „редовното“ обучение, продуктивният модел в реално време получава и „предложение за оптимизация“ на неговата спецификация - в която се променя наборът от входни променливи, променят се стойностите на параметрите (вече не в резултат на обучение в Python, но в резултат на обучение с „алтернативна“ ” версия на себе си, като H2O стека), което позволява на цялостното AI/ML решение да се справя автономно с неочаквани промени в естеството на входните данни и явленията, които се моделират .

Нека се запознаем по-подробно с функционалността на платформата AI/ML на InterSystems IRIS, като използваме примера на реален прототип.

На диаграмата по-долу, от лявата страна на слайда има част от бизнес процеса, който изпълнява изпълнението на скриптове в Python и R. В централната част има визуални регистрационни файлове на изпълнението на някои от тези скриптове, съответно, в Python и R. Непосредствено зад тях са примери за съдържание на един и друг език, прехвърлени за изпълнение в съответните среди. В края вдясно има визуализации, базирани на резултатите от изпълнението на скрипта. Визуализациите в горната част бяха направени на IRIS Analytics (данните бяха взети от Python в платформата за данни на InterSystems IRIS и показани на табло с помощта на платформата), в долната част бяха направени директно в работната сесия на R и изведени оттам в графични файлове . Важен аспект: представеният фрагмент в прототипа е отговорен за обучението на модела (класификация на състоянията на оборудването) върху данни, получени в реално време от процеса на симулатора на оборудването, по команда от процеса на наблюдение на качеството на класификацията, наблюдаван по време на прилагането на модела. Прилагането на AI/ML решение под формата на набор от взаимодействащи процеси („агенти“) ще бъде обсъдено допълнително.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 12 Взаимодействие с Python, R и Julia в InterSystems IRIS

Процесите на платформата (те също са „бизнес процеси“, „аналитични процеси“, „тръбопроводи“ и т.н. - в зависимост от контекста), първо се редактират в графичния редактор на бизнес процеси в самата платформа и в такъв начин, по който неговата блокова диаграма и съответният AI/ML механизъм (програмен код) се създават едновременно. Когато казваме, че „се получава механизъм AI/ML“, първоначално имаме предвид хибридност (в рамките на един процес): съдържанието на езиците на средите за математическо моделиране е в съседство със съдържанието в SQL (включително разширения от Интегриран ML), в InterSystems ObjectScript, с други поддържани езици. Освен това процесът на платформата предоставя много широки възможности за „рендиране“ под формата на йерархично вложени фрагменти (както може да се види в примера на диаграмата по-долу), което ви позволява ефективно да организирате дори много сложно съдържание, без изобщо да „изпада“ на графичния формат (в „неграфични” формати). » методи/класове/процедури и др.). Тоест, ако е необходимо (а това е предвидено в повечето проекти), абсолютно цялото AI/ML решение може да бъде имплементирано в графичен самодокументиращ се формат. Моля, обърнете внимание, че в централната част на диаграмата по-долу, която представлява по-високо „ниво на влагане“, е ясно, че в допълнение към действителната работа по обучението на модела (използвайки Python и R), се извършва анализ на т.нар. Добавя се ROC крива на обучения модел, което позволява визуално (и изчислително) да се оцени качеството на обучението - и този анализ се изпълнява на езика Julia (изпълнен, съответно, в математическата среда Julia).

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 13 Визуална среда за композиране на AI/ML решения в InterSystems IRIS

Както бе споменато по-рано, първоначалното разработване и (в някои случаи) адаптиране на AI/ML механизми, които вече са внедрени в платформата, ще/може да се извърши извън платформата в редактора на Jupyter. На диаграмата по-долу виждаме пример за адаптиране на съществуващ процес на платформа (същият като на диаграмата по-горе) - така изглежда фрагментът, който отговаря за обучението на модела в Jupyter. Съдържанието на Python е достъпно за редактиране, отстраняване на грешки и графичен изход директно в Jupyter. Промените (ако е необходимо) могат да бъдат направени с незабавна синхронизация в процеса на платформата, включително нейната продуктивна версия. Ново съдържание може да бъде прехвърлено към платформата по подобен начин (нов процес на платформата се генерира автоматично).

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 14 Използване на Jupyter Notebook за редактиране на AI/ML машината в платформата InterSystems IRIS

Адаптирането на процес на платформа може да се извърши не само в графичен или лаптоп формат, но и в „тоталния“ IDE (интегрирана среда за разработка) формат. Тези IDE са IRIS Studio (родно IRIS студио), Visual Studio Code (InterSystems IRIS разширение за VSCode) и Eclipse (Atelier плъгин). В някои случаи е възможно екипът за разработка да използва и трите IDE едновременно. Диаграмата по-долу показва пример за редактиране на същия процес в IRIS studio, в Visual Studio Code и в Eclipse. Абсолютно цялото съдържание е достъпно за редактиране: Python/R/Julia/SQL, ObjectScript и бизнес процес.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 15 Развитие на бизнес процеса InterSystems IRIS в различни IDE

Инструментите за описване и изпълнение на бизнес процесите на InterSystems IRIS на Business Process Language (BPL) заслужават специално внимание. BPL дава възможност да се използват „готови интеграционни компоненти“ (дейности) в бизнес процесите - което всъщност дава всички основания да се каже, че „непрекъснатата интеграция“ е внедрена в InterSystems IRIS. Готовите компоненти на бизнес процеси (дейности и връзки между тях) са мощен ускорител за асемблиране на AI/ML решение. И не само сглобки: благодарение на дейностите и връзките между тях върху различни AI/ML разработки и механизми, възниква „автономен управленски слой“, способен да взема решения според ситуацията в реално време.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 16 Готови компоненти на бизнес процеси за непрекъсната интеграция (CI) на платформата InterSystems IRIS

Концепцията за агентни системи (известна също като „мултиагентни системи“) има силна позиция в роботизацията и платформата InterSystems IRIS органично я поддържа чрез конструкцията „продукт-процес“. В допълнение към неограничените възможности за „напълване“ на всеки процес с функционалността, необходима за цялостното решение, придаването на системата от платформени процеси със свойството „агентство“ ви позволява да създавате ефективни решения за изключително нестабилни симулирани явления (поведение на социални/ биосистеми, частично наблюдавани технологични процеси и др.).

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 16 Работа на AI/ML решение като система за бизнес процеси, базирана на агенти в InterSystems IRIS

Продължаваме нашия преглед на InterSystems IRIS с история за приложното използване на платформата за решаване на цели класове проблеми в реално време (доста подробно въведение в някои от най-добрите практики на платформата AI/ML на InterSystems IRIS може да се намери в един от предишния ни уеб семинари).

По петите на предишната диаграма, по-долу е по-подробна диаграма на агентната система. Диаграмата показва един и същ прототип, виждат се и четирите агентни процеса, взаимовръзките между тях са схематично начертани: ГЕНЕРАТОР - обработва създаването на данни от сензорите на оборудването, БУФЕР - управлява опашки от данни, АНАЛИЗАР - извършва самото машинно обучение, МОНИТОР - следи качество на машинното обучение и подава сигнал за необходимостта от преквалификация на модела.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 17 Състав на AI/ML решение под формата на система за бизнес процеси, базирана на агенти в InterSystems IRIS

Диаграмата по-долу илюстрира автономното функциониране на друг роботизиран прототип (разпознаване на емоционалното оцветяване на текстове) за известно време. В горната част е еволюцията на показателя за качество на обучението по модела (качеството нараства), в долната част е динамиката на показателя за качество на прилагането на модела и фактите за повторно обучение (червени ивици). Както можете да видите, решението се е научило ефективно и автономно и работи на дадено ниво на качество (стойностите на качествения рейтинг не падат под 80%).

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 18 Непрекъснато (само)обучение (CT) на платформата InterSystems IRIS

Също така споменахме „auto-ML“ по-рано, но диаграмата по-долу показва използването на тази функционалност в детайли, използвайки примера на друг прототип. Графичната диаграма на фрагмент от бизнес процес показва дейността, която задейства моделирането в H2O стека, показва резултатите от това моделиране (ясното доминиране на получения модел над „създадените от човека“ модели, според сравнителната диаграма на ROC криви, както и автоматизираната идентификация на „най-влиятелните променливи“, налични в оригиналния набор от данни). Важен момент тук е спестяването на време и експертни ресурси, което се постига чрез „auto-ML“: това, което процесът на нашата платформа прави за половин минута (намиране и обучение на оптималния модел), може да отнеме на експерт от седмица до месец.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 19 Интегриране на „auto-ML“ в решение AI/ML на платформата InterSystems IRIS

Диаграмата по-долу малко пропуска смисъла, но е добър начин да завършим историята за решаваните класове проблеми в реално време: напомняме ви, че с всички възможности на платформата InterSystems IRIS, моделите за обучение под нейния контрол са не е задължително. Платформата може да получи отвън така наречената PMML спецификация на модела, обучена в инструмент, който не е под контрола на платформата - и да приложи този модел в реално време от момента, в който бъде импортиран PMML спецификации. Важно е да се вземе предвид, че не всички AI/ML артефакти могат да бъдат намалени до PMML спецификация, дори ако повечето от най-често срещаните артефакти позволяват това. По този начин платформата InterSystems IRIS е „отворена верига“ и не означава „робство на платформа“ за потребителите.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 20 Интегриране на „auto-ML“ в решение AI/ML на платформата InterSystems IRIS

Нека изброим допълнителните предимства на платформата на InterSystems IRIS (за по-голяма яснота, във връзка с контрола на процесите), които са от голямо значение за автоматизацията на изкуствения интелект и машинното обучение в реално време:

  • Разработени инструменти за интеграция с всякакви източници на данни и потребители (система за контрол на процеси/SCADA, оборудване, MRO, ERP и др.)
  • Вграден многомоделна СУБД за високопроизводителна транзакционна и аналитична обработка (Hybrid Transaction/Analytical Processing, HTAP) на всякакъв обем данни от технологични процеси
  • Инструменти за разработка за непрекъснато внедряване на AI/ML двигатели за решения в реално време, базирани на Python, R, Julia
  • Адаптивни бизнес процеси за непрекъсната интеграция и (само)обучение на AI/ML решения в реално време
  • Вградени инструменти за бизнес разузнаване за визуализиране на данни от процеса и резултатите от AI/ML решение
  • API управление за предоставяне на резултатите от решението AI/ML към системи за управление на процеси/SCADA, информационни и аналитични системи, изпращане на предупреждения и др.

AI/ML решенията на платформата InterSystems IRIS лесно се вписват в съществуващата ИТ инфраструктура. Платформата InterSystems IRIS гарантира висока надеждност на AI/ML решения, като поддържа устойчиви на грешки и бедствия конфигурации и гъвкаво внедряване във виртуални среди, на физически сървъри, в частни и обществени облаци и Docker контейнери.

По този начин InterSystems IRIS е универсална AI/ML изчислителна платформа в реално време. Универсалността на нашата платформа се потвърждава на практика от липсата на фактически ограничения върху сложността на изпълняваните изчисления, способността на InterSystems IRIS да комбинира (в реално време) обработка на сценарии от голямо разнообразие от индустрии и изключителната адаптивност на всякакви платформени функции и механизми за специфичните нужди на потребителите.

InterSystems IRIS - универсална AI/ML платформа в реално време
Фигура 21 InterSystems IRIS - универсална AI/ML изчислителна платформа в реално време

За по-съдържателно взаимодействие с онези от нашите читатели, които се интересуват от представения тук материал, препоръчваме да не се ограничавате до четенето му и да продължите диалога „на живо“. Ще се радваме да предоставим подкрепа при формулирането на AI/ML сценарии в реално време във връзка със спецификата на вашата компания, да извършим съвместно прототипиране на платформата InterSystems IRIS, да формулираме и приложим на практика пътна карта за въвеждане на изкуствен интелект и машинно обучение във вашите производствени и управленски процеси. Нашият AI/ML експертен екип Имейл за връзка – [имейл защитен].

Източник: www.habr.com

Добавяне на нов коментар