InterSystems IRIS - 通用實時 AI/ML 平台

作者:Sergey Lukyanchikov,InterSystems 諮詢工程師

實時 AI/ML 計算挑戰

讓我們從 InterSystems 的數據科學實踐經驗的例子開始:

  • “加載”的買家門戶連接到在線推薦系統。 零售網絡規模促銷的重組即將到來(例如,現在將使用“細分策略”矩陣,而不是“扁平”促銷線)。 推薦人會怎樣? 向推薦機制提交和更新數據會發生什麼(輸入數據量增加了 25000 倍)? 推薦的發展會發生什麼變化(由於推薦規則的數量和“範圍”增加了千倍,因此需要將推薦規則的過濾閾值降低千倍)?
  • 有一個系統用於監控設備節點中出現缺陷的可能性。 過程控制系統連接到監控系統,每秒傳輸數千個過程參數。 之前做“人工抽樣”的監控系統怎麼辦(能否提供秒級概率監控)? 如果輸入數據中出現一個包含數百列的新塊,其中包含最近添加到過程控制系統的傳感器的讀數,將會發生什麼情況(是否需要停止監控系統以及需要多長時間才能將來自新傳感器的數據包含在過程控制系統中)分析)?
  • 使用彼此工作的結果,已經創建了一套 AI/ML 機制(推薦、監控、預測)。 每月需要多少工時才能使該綜合設施的運行適應輸入數據的變化? 決策綜合體支持的整體“減速”是多少(其中新支持信息的出現頻率相對於新輸入數據的出現頻率)?

總結這些和許多其他例子,我們得出了在轉向使用機器學習和實時人工智能機制時出現的挑戰:

  • 我們對我們公司 AI / ML 開發的創造和適應(適應不斷變化的情況)的速度是否滿意?
  • 我們使用的 AI/ML 解決方案在多大程度上支持實時業務管理?
  • 我們使用的 AI/ML 解決方案是否能夠獨立(無需開發人員)適應數據和業務管理實踐的變化?

我們的文章詳細概述了 InterSystems IRIS 平台在對 AI/ML 機制部署的普遍支持、AI/ML 解決方案的組裝(集成)以及 AI/ML 解決方案在密集數據上的訓練(測試)方面的能力流動。 我們將轉向市場研究、AI/ML 解決方案的案例研究,以及我們在本文中稱為實時 AI/ML 平台的概念方面。

我們從調查中了解到:實時應用程序

Результаты 民意調查Lightbend 在 800 年對約 2019 名 IT 專業人士進行的調查不言而喻:

InterSystems IRIS - 通用實時 AI/ML 平台
圖 1 實時數據的主要消費者

讓我們在翻譯中引用對我們很重要的關於這項調查結果的報告片段:

“......數據流集成工具的流行趨勢以及對容器化計算的支持為市場需求提供了協同響應,以提供更高效、合理、動態的有效解決方案建議。 數據流允許比傳統分組數據更快地傳輸信息。 除此之外,還能夠快速應用計算方法,例如基於 AI/ML 的建議,以通過提高客戶滿意度來創造競爭優勢。 敏捷性競賽也影響了 DevOps 範例中的所有角色——使應用程序開發和部署更加高效。 …… 41 名 IT 專業人員提供了有關其組織中數據流使用的信息。 受訪者主要位於西方國家(37% 在歐洲,XNUMX% 在北美),並且幾乎平均分佈在大中小型公司中。 ……

……人工智能不是炒作。 已經在高效的 AI/ML 應用程序中使用數據流處理的人中有 XNUMX% 確認明年他們在 AI/ML 中的使用將獲得最大收益(與其他應用程序相比)。

  • 大多數受訪者認為,AI/ML 場景中數據流的使用將在明年獲得最大增幅。
  • AI/ML 中的應用程序不僅會通過相對較新的場景類型增長,還會通過越來越多地使用實時數據的傳統場景增長。
  • 除了 AI/ML,物聯網數據管道用戶的熱情程度令人印象深刻——48% 已經集成物聯網數據的用戶表示,在不久的將來,基於這些數據的場景實施將獲得顯著增長。 … »

從這個頗為有趣的調查可以看出,機器學習和人工智能場景作為數據流消費領頭羊的感知已經“在路上”。 但是通過 DevOps 光學對實時 AI / ML 的感知成為一個同樣重要的觀察:在這裡我們已經可以開始談論“一次性 AI / ML 具有完全可訪問的數據集”的仍然占主導地位的文化的轉變。

實時 AI/ML 平台概念

實時 AI/ML 的一個典型應用是製造過程控制。 基於它的示例並考慮到之前的思考,我們將製定實時 AI/ML 平台的概念。
在過程控制中使用人工智能和機器學習具有許多特點:

  • 集中接收有關工藝過程狀態的數據:頻率高且參數範圍廣(過程控制系統每秒傳輸多達數万個參數值)
  • 相反,關於缺陷檢測的數據,更不用說它們的發展數據,是稀缺和不規則的,其特點是缺陷類型和及時定位不足(通常以紙質記錄為代表)
  • 從實用的角度來看,只有初始數據的“相關窗口”可用於訓練和應用模型,以合理的滑動間隔反映工藝過程的動態,以工藝參數的最後讀取值結束

這些功能迫使我們,除了從流程中接收和基本實時處理密集的“寬帶輸入”之外,還要執行(並行)AI / ML 模型工作結果的應用、培訓和質量控制 -也是實時的。 我們的模型在相關性滑動窗口中“看到”的“框架”在不斷變化——隨之而來的是,過去在其中一個“框架”上訓練的 AI/ML 模型的工作結果質量也會發生變化. 如果 AI / ML 模型的工作結果質量惡化(例如:“alarm-norm”分類錯誤的值超出了我們定義的界限),模型的再訓練應該在更早的時候自動開始相關的“框架”——以及開始重新訓練模型的時刻的選擇應該考慮到訓練本身的持續時間,以及當前版本模型質量惡化的動態(因為當前版本在訓練模型時繼續應用模型的一部分,直到生成它們的“新訓練”版本)。

InterSystems IRIS 具有關鍵平台功能,可以為過程控制提供實時 AI/ML 解決方案。 這些可能性可以分為三大類:

  • 持續部署(Continuous Deployment / Delivery,CD)新的或改編的現有 AI / ML 機製到在 InterSystems IRIS 平台上實時運行的高效解決方案中
  • 持續集成 (CI) 到一個單一的生產解決方案中,輸入過程數據流、用於 AI/ML 機制的應用/培訓/質量控制的數據隊列以及與數學建模環境的數據/代碼/控制交換,這些都是實時編排的InterSystems IRIS 平台
  • 使用 InterSystems IRIS 平台傳輸的數據、代碼和控制動作(“做出的決定”)在數學建模環境中執行的 AI/ML 機制的持續(自我)學習(持續訓練,CT)

與機器學習和人工智能相關的平台能力在這些群體中的分類並非偶然。 讓我們引用方法論 出版物 為這種分類提供概念基礎的谷歌,在我們的翻譯中:

“……最近流行的 DevOps 概念涵蓋了大型信息系統的開發和運營。 實施這一概念的優勢在於縮短了開發週期的持續時間、加快了開發部署、發布計劃的靈活性。 為了實現這些好處,DevOps 涉及至少兩種實踐的實施:

  • 持續集成(CI)
  • 持續交付 (CD)

這些實踐也適用於 AI/ML 平台,以確保構建可靠且高效的高效 AI/ML 解決方案。

AI/ML 平台在以下方面不同於其他信息系統:

  • 團隊能力:在構建 AI/ML 解決方案時,團隊通常包括數據科學家或進行數據分析、模型開發和驗證的數據科學家。 這些團隊成員可能不是生產代碼的專業開發人員。
  • 開發:AI/ML 機製本質上是實驗性的。 為了以最有效的方式解決問題,需要對輸入變量、算法、建模方法和模型參數的各種組合進行排序。 這種搜索的複雜性在於追踪“什麼有效/無效”,確保事件的可重複性,概括重複實施的發展。
  • 測試:測試 AI/ML 機制需要比大多數其他開發更大範圍的測試。 除了典型的單元和集成測試外,還測試了數據的有效性以及將模型應用於訓練和控製樣本的結果質量。
  • 部署:AI/ML 解決方案的部署不限於應用曾經訓練過的模型的預測服務。 AI / ML 解決方案圍繞多階段管道構建,這些管道執行模型的自動化訓練和應用。 部署此類管道涉及將傳統上由數據科學家手動執行的重要步驟自動化,以便能夠訓練和測試模型。
  • 高效:AI/ML 引擎可能會缺乏性能,這不僅是因為編程效率低下,還因為輸入數據的性質不斷變化。 換句話說,與傳統開發的性能相比,AI/ML 機制的性能可能由於更廣泛的原因而降低。 這導致需要(在線)監控我們的 AI/ML 引擎的性能,並在性能未達到預期時發送警報或拒絕結果。

AI/ML 平台與其他信息系統類似,都需要持續代碼集成與版本控制、單元測試、集成測試、持續開發部署。 但是,就 AI/ML 而言,存在一些重要差異:

  • CI(持續集成)不再局限於測試和驗證已部署組件的代碼——它還包括測試和驗證數據以及 AI/ML 模型。
  • CD(Continuous Delivery/Deployment,持續部署)並不局限於編寫和發布包或服務,而是暗示了一個用於編寫、學習和應用 AI/ML 解決方案的平台。
  • CT(Continuous Training,持續學習)——新元素[約。 文章作者:與傳統 DevOps 概念相關的新元素,其中 CT 通常是持續測試],AI / ML 平台固有,負責自主管理學習和應用 AI / ML 模型的機制。 ……”

我們可以說,處理實時數據的機器學習和人工智能需要更廣泛的工具和能力(從代碼開發到數學建模環境的編排)、所有功能和主題領域之間更緊密的集成、更有效的人員組織和機資源。

實時場景:識別進料泵缺陷的發展

繼續以過程控制領域為例,考慮一個具體的任務(我們一開始就提到過):需要根據過程參數的流向,對泵的缺陷發展情況進行實時監控以及維護人員關於檢測到的缺陷的報告。

InterSystems IRIS - 通用實時 AI/ML 平台
圖2 缺陷發展監控任務的製定

在實踐中以這種方式設置的大多數任務的特殊性在於,應在各種類型缺陷的偶發和不規則發生(和註冊)背景下考慮數據接收(APCS)的規律性和效率。 換句話說:來自過程控制系統的數據每秒準確一次,並且在車間的通用筆記本中用不可擦除的鉛筆記錄缺陷並註明日期(例如:“12.01 - 洩漏到封面從第三個軸承的一側”)。

因此,可以用以下重要限制來補充問題的表述:我們只有一個特定類型缺陷的“標籤”(即,特定類型缺陷的示例由來自特定日期的過程控制系統 - 我們沒有更多此類特定類型缺陷的示例)。 這種限制立即使我們超出了經典機器學習(監督學習)的範圍,經典機器學習應該有很多“標籤”。

InterSystems IRIS - 通用實時 AI/ML 平台
圖3 細化監控缺陷發展的任務

我們能否以某種方式“乘以”我們所掌握的唯一“標籤”? 我們可以。 泵的當前狀態的特徵在於與註冊缺陷的相似程度。 即使不使用量化的方法,在視覺感知層面,觀察過程控制系統傳來的數據值的動態變化,也已經可以學到很多東西:

InterSystems IRIS - 通用實時 AI/ML 平台
圖 4 給定類型缺陷“標記”背景下泵狀態的動態變化

但視覺感知(至少目前)並不是我們快速變化的場景中最合適的“標籤”生成器。 我們將使用統計測試評估泵的當前狀態與報告缺陷的相似性。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 5 在缺陷“標籤”的背景下對傳入數據應用統計測試

統計測試確定了從過程控制系統接收到的“流包”中具有工藝過程參數值的記錄與某種類型缺陷的“標籤”記錄相似的概率。 作為應用統計測試的結果計算出的概率值(統計相似性指數)被轉換為 0 或 1 的值,成為相似包中每個特定記錄中機器學習的“標籤”。 也就是說,在用統計測試處理新收到的泵狀態記錄包之後,我們有機會(a)將這個包添加到訓練樣本中以訓練 AI/ML 模型,以及(b)監控應用於此包時模型的當前版本。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 6 將機器學習模型應用於缺陷“標籤”背景下的傳入數據

在我們之前的一個 網絡研討會 我們展示並解釋了 InterSystems IRIS 平台如何讓您以持續執行業務流程的形式實施任何 AI/ML 機制,以控制模擬結果的可靠性並調整模型參數。 在使用泵實現我們的場景原型時,我們使用網絡研討會期間展示的所有 InterSystems IRIS 功能 - 作為我們解決方案的一部分在分析器過程中實現,不是經典的監督學習,而是強化學習,它自動控製樣本進行訓練楷模。 記錄被放置在訓練樣本中,在應用統計測試和模型的當前版本之後發生“檢測共識” - 即統計測試(在相似性指數轉換為 0 或 1 之後)和模型在這樣的記錄 1 上產生了結果。通過對模型進行新的訓練,在其驗證期間(新訓練的模型應用於其自己的訓練樣本,並對其進行初步的統計測試),記錄“做了not hold” 將統計檢驗處理後的結果 1(由於訓練中不斷存在缺陷的原始“標籤”的記錄樣本)從訓練樣本中移除,新版本的模型學習來自缺陷的“標籤”加上來自流的“保留”記錄。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 7 InterSystems IRIS 中 AI/ML 計算的自動化

如果需要對 InterSystems IRIS 中本地計算獲得的檢測質量提供某種“第二意見”,則會創建一個顧問進程,以使用雲服務(例如 Microsoft Azure)在控制數據集上執行訓練應用模型、亞馬遜網絡服務、谷歌云平台等):

InterSystems IRIS - 通用實時 AI/ML 平台
圖 8 由 InterSystems IRIS 協調的來自 Microsoft Azure 的第二意見

我們在 InterSystems IRIS 中的場景原型是以基於代理的分析過程系統的形式製作的,該系統與設備對象(泵)、數學建模環境(Python、R 和 Julia)交互,並提供所有的自學習涉及 AI/ML 機制——關於實時數據流。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 9 InterSystems IRIS 中實時 AI/ML 解決方案的主要功能

我們原型的實際結果:

  • 模型識別的缺陷模式(12 月 XNUMX 日):

InterSystems IRIS - 通用實時 AI/ML 平台

  • 模型識別出的發展中的缺陷,未包含在樣本中(11 月 13 日,修復團隊僅在兩天后 - XNUMX 月 XNUMX 日確定了缺陷本身):

InterSystems IRIS - 通用實時 AI/ML 平台
對包含同一缺陷的多個事件的真實數據的模擬表明,我們在 InterSystems IRIS 平台上實施的解決方案使我們能夠在維修團隊檢測到此類缺陷前幾天檢測到它們的發展。

InterSystems IRIS - 通用實時 AI/ML 計算平台

InterSystems IRIS 平台簡化了實時數據解決方案的開發、部署和操作。 InterSystems IRIS 能夠同時執行交易和分析數據處理; 根據多種模型(包括關係模型、分層模型、對像模型和文檔模型)維護數據的同步視圖; 作為廣泛的數據源和個人應用程序的集成平台; 提供對結構化和非結構化數據的高級實時分析。 InterSystems IRIS 還提供使用外部分析工具的機制,允許靈活地將託管在雲中和本地服務器上結合起來。

基於 InterSystems IRIS 平台構建的應用程序已部署到各行各業,幫助公司從戰略和運營角度實現顯著的經濟價值,加強決策制定並縮小事件、分析和行動之間的差距。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 10 實時 AI/ML 環境下的 InterSystems IRIS 架構

與上圖一樣,下圖將新的“坐標系”(CD/CI/CT) 與平台工作項之間的信息流相結合。 可視化從 CD 宏機制開始,然後是 CI 和 CT 宏機制。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 11 InterSystems IRIS 平台的 AI/ML 元素之間的信息流方案

InterSystems IRIS 中 CD 機制的本質:平台用戶(AI/ML 解決方案開發人員)使用專門的 AI/ML 機制代碼編輯器:Jupyter(全稱:Jupyter Notebook;也,為簡潔起見,有時將在此編輯器中創建的文檔稱為)。 在 Jupyter 中,開發人員有機會編寫、調試和驗證特定 AI/ML 開發的性能(包括使用圖形),然後再將其託管(“部署”)在 InterSystems IRIS 中。 很明顯,以這種方式創建的新開發將只接受基本調試(特別是因為 Jupyter 不使用實時數據流)——這是按順序進行的,因為 Jupyter 開發的主要結果是對單獨 AI / ML 機制的基本可操作性的確認(“在數據樣本上顯示預期結果”)。 同樣,在 Jupyter 中調試之前已經放置在平台中的機制(請參閱以下宏機制)可能需要“回滾”到“平台前”形式(從文件讀取數據,通過 xDBC 而不是表格處理數據,與全局變量的直接交互——多維數據數組 InterSystems IRIS——等等)。

InterSystems IRIS 中 CD 實現的一個重要方面是在平台和 Jupyter 之間實現了雙向集成,這允許您將 Python、R 和 Julia(這三個都是相應領先的數學建模開源環境中的編程語言)。 因此,AI/ML 內容開發人員能夠將此內容“持續部署”到平台,在他們熟悉的 Jupyter 編輯器中工作,使用熟悉的 Python、R、Julia 庫,並在平台外執行基本調試(如有必要) .

讓我們繼續討論 InterSystems IRIS 中 CI 的宏觀機制。 該圖顯示了“實時機器人”的宏觀流程(由它們以 mats 語言和 ObjectScript 語言(InterSystems 的原生開發語言)編排的數據結構、業務流程和代碼片段的複合體虹膜)。 這個宏過程的任務是維護 AI/ML 機制運行所需的數據隊列(基於實時傳輸到平台的數據流),決定應用程序的順序和 AI/ML 的“範圍” ML 機制(它們也是“數學算法”、“模型”等——可能根據具體實現和術語偏好而有不同的稱呼),使數據結構保持最新以分析 AI/ML 機制的工作結果(多維數據集、表格、多維數據數組等)。等等 - 用於報告、儀表板等)。

在 InterSystems IRIS 中實施 CI 的一個重要方面是在平台和數學建模環境之間實現了雙向集成,這允許在各自的環境中以 Python、R 和 Julia 執行平台中託管的內容,並返回執行結果. 這種集成在“終端模式”(即 AI/ML 內容被表述為調用 mats 的 ObjectScript 代碼)和“業務流程模式”(即 AI/ML 內容被表述為使用圖形編輯器的業務流程,或者有時使用 Jupyter,或者使用 IDE——IRIS Studio、Eclipse、Visual Studio Code)。 業務流程在Jupyter中的可編輯性體現在CI層面的IRIS和CD層面的Jupyter之間的關係。 下面給出了與數學建模環境集成的更詳細概述。 在這個階段,我們認為,有充分的理由在平台中修復所有必要工具的存在,以實現 AI / ML 開發(來自“持續部署”)的“持續集成”到實時 AI /機器學習解決方案。

以及主要的宏觀機制:CT。 沒有它,就沒有 AI/ML 平台(雖然“實時”將通過 CD/CI 實現)。 CT 的本質是平台在數學建模環境的工作會話中直接使用機器學習和人工智能的“工件”:模型、分佈表、矩陣向量、神經網絡層等。 在大多數情況下,這種“工作”包括在環境中創建上述工件(例如,在模型的情況下,“創建”包括設置模型規範和隨後選擇其參數值 -所謂的模型“訓練”),它們的應用(對於模型:使用它們來計算目標變量的“模型”值——預測、屬於某個類別、事件發生的概率等)和改進已經創建和應用的工件(例如,根據應用結果重新定義模型輸入變量集——為了提高預測準確性,作為一個選項)。 理解 CT 作用的關鍵點是它從 CD 和 CI 的現實中“抽象”出來:CT 將實現所有工件,在特定環境提供的能力範圍內專注於 AI/ML 解決方案的計算和數學細節. “提供輸入數據”和“交付結果”的責任將由 CD 和 CI 負責。

InterSystems IRIS 中 CT 實施的一個重要方面:使用與上面已經提到的數學建模環境的集成,該平台能夠從在其控制的環境中運行的工作會話中提取相同的工件,並且(最重要的是)將它們轉化為平台數據對象。 例如,剛剛在工作 Python 會話中創建的分佈表可以(無需停止 Python 中的會話)以全局(多維 InterSystems IRIS 數據數組)的形式傳輸到平台 - 並使用用於在另一種 AI/ML 機制(已經在另一種環境的語言中實現——例如,在 R 中)——或虛擬表中進行計算。 另一個例子:與模型運行的“正常模式”(在 Python 工作會話中)並行,對其輸入數據進行“auto-ML”:自動選擇最佳輸入變量和參數值。 隨著“常規”訓練,實時生產模型還收到了針對其規範的“優化建議”——其中輸入變量集發生變化,參數值發生變化(不是由於 Python 訓練的結果,但作為訓練“自身的替代版本,例如在 H2O 堆棧中”的結果,允許整個 AI/ML 解決方案自主處理輸入數據和正在建模的現象的性質的不可預見的變化。

讓我們以真實原型為例,更詳細地了解 InterSystems IRIS 的平台 AI/ML 功能。

在下圖中,在幻燈片的左側,有一部分業務流程實現了 Python 和 R 腳本的處理。在中央部分,有一些腳本執行的可視化日誌,分別在 Python 和 R 中。緊隨其後的是一種和另一種語言的內容示例,這些內容已提交以在適當的環境中執行。 右端是基於腳本執行結果的可視化。 頂部的可視化是在 IRIS Analytics 上製作的(數據從 Python 獲取到 InterSystems IRIS 數據平台,並使用該平台顯示在儀表板上),在底部,它們是在 R 工作會話中製作的,並從那裡輸出到圖形文件。 一個重要方面:原型中呈現的片段負責根據來自設備過程模擬器的實時數據訓練模型(設備狀態分類),根據分類質量過程監視器的命令在模型應用過程中觀察到。 將進一步討論作為一組交互過程(“代理”)的 AI/ML 解決方案的實施。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 12 在 InterSystems IRIS 中與 Python、R 和 Julia 交互

平台流程(它們也是“業務流程”、“分析流程”、“管道”等——取決於上下文)主要在平臺本身的圖形業務流程編輯器中進行編輯,並且以這樣一種方式它的框圖和相應的AI/ML機制(程序代碼)是同時創建的。 說到“獲得 AI/ML 機制”這一事實,我們最初指的是混合性(在同一進程內):數學建模環境語言中的內容與 SQL 中的內容相鄰(包括從 集成機器學習),在 InterSystems ObjectScript 中,以及其他支持的語言。 此外,平台流程為以分層嵌套片段的形式“繪製”提供了非常廣泛的可能性(如下圖示例所示),這使您可以有效地組織非常複雜的內容,而不會“掉線”任何地方的圖形格式(進入“非圖形”方法/類/過程等)。 也就是說,如果有必要(大多數項目都希望如此),絕對所有 AI/ML 解決方案都可以以圖形化的自我評論格式實施。 請注意,在下圖的中央部分,顯示了更高的“嵌套級別”,您可以看到除了訓練模型的實際工作(使用 Python 和 R)之外,對所謂的 ROC 的分析添加了訓練模型的曲線,這允許從視覺上(以及計算上)評估訓練的質量——並且這種分析是用 Julia 語言實現的(分別在 Julia 環境中執行)。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 13 在 InterSystems IRIS 中組合 AI/ML 解決方案的可視化環境

如前所述,平台中已實施的 AI/ML 機制的初始開發和(在某些情況下)改編將/可以在 Jupyter 編輯器中在平台外完成。 在下圖中,我們看到了一個調整現有平台流程的示例(與上圖相同)——這就是負責訓練模型的片段在 Jupyter 中的樣子。 Python 內容可直接在 Jupyter 中進行編輯、調試、圖形輸出。 可以通過即時同步平台流程(包括其生產版本)來進行更改(如有必要)。 同樣,新的內容可以轉移到平台(自動生成一個新的平台流程)。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 14 使用 Jupyter 筆記本編輯 InterSystems IRIS 平台中的 AI/ML 引擎

平台過程的適配不僅可以以圖形或筆記本格式進行,還可以以“總”IDE(集成開發環境)格式進行。 這些 IDE 是 IRIS Studio(本地 IRIS 工作室)、Visual Studio Code(VSCode 的 InterSystems IRIS 擴展)和 Eclipse(Atelier 插件)。 在某些情況下,開發團隊可以同時使用所有三個 IDE。 下圖顯示了在 IRIS studio、Visual Studio Code 和 Eclipse 中編輯相同流程的示例。 絕對可以編輯所有內容:Python/R/Julia/SQL、ObjectScript 和業務流程。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 15 在各種 IDE 中開發 InterSystems IRIS 業務流程

以業務流程語言 (BPL) 編寫的 InterSystems IRIS 業務流程描述和執行工具值得特別提及。 BPL 使得在業務流程中使用“現成的集成組件”(活動)成為可能——事實上,這充分有理由斷言“持續集成”已在 InterSystems IRIS 中實現。 現成的業務流程組件(活動和它們之間的鏈接)是組裝 AI/ML 解決方案的最強大的加速器。 不僅是組件:由於它們之間的活動和聯繫,在不同的 AI / ML 開發和機制上,出現了一個能夠根據情況實時做出決策的“自主管理層”。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 16 用於在 InterSystems IRIS 平台上進行持續集成 (CI) 的現成業務流程組件

代理系統(它們也稱為“多代理系統”)的概念在機器人技術中佔有重要地位,InterSystems IRIS 平台通過“產品-過程”結構有機地支持它。 除了為每個進程“填充”整體解決方案所需的功能的無限可能性之外,賦予平台進程系統“代理”屬性允許您為極不穩定的模擬現象(社會/生物系統的行為)創建有效的解決方案,部分可觀察的技術過程等)。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 16 AI/ML 解決方案在 InterSystems IRIS 中作為業務流程代理系統的運行

我們繼續對 InterSystems IRIS 進行回顧,講述了該平台在解決各類實時問題中的應用(在我們之前的一篇文章中,我們相當詳細地了解了 InterSystems IRIS 平台 AI / ML 的一些最佳實踐) 網絡研討會).

緊接著上圖,下面是更詳細的代理系統圖。 該圖顯示了相同的原型,所有四個代理進程都是可見的,它們之間的關係被示意性地繪製:GENERATOR - 處理設備傳感器的數據創建,BUFFER - 管理數據隊列,ANALYZER - 執行機器學習本身,MONITOR - 控制機器學習的質量,並提供模型需要重新訓練的信號。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 17 作為 InterSystems IRIS 中的業務流程代理系統的 AI/ML 解決方案的組成

下圖說明了一段時間內另一個機器人原型(情感文本識別)的自主功能。 上半部分 - 模型學習質量指標的演變(質量在增長),下半部分 - 模型應用質量指標的動態和重複訓練的事實(紅色條)。 如您所見,解決方案已經高效自主地進行了自我學習,並在給定的質量水平上工作(質量指標的值不低於 80%)。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 18 InterSystems IRIS 平台上的持續(自)學習 (CT)

前面我們也提到了“auto-ML”,但下圖以另一個原型為例詳細說明了該功能的應用。 業務流程片段的圖表顯示了在 H2O 堆棧中啟動模擬的活動,顯示了此模擬的結果(根據 ROC 曲線的比較圖表,結果模型明顯優於“人造”模型,以及從原始數據集中可用的“最有影響力的變量”的自動識別)。 這裡的重點是節省時間和專家資源,這是通過“auto-ML”實現的:我們的平台流程在半分鐘內完成的事情(找到並訓練最佳模型),專家可能需要一周到月。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 19 Auto-ML 集成到基於 InterSystems IRIS 平台的 AI/ML 解決方案

下圖稍微“降低了高潮”,但這是完成有關正在解決的實時問題類別的故事的好方法:我們提醒您,利用 InterSystems IRIS 平台的所有功能,訓練模型它的控制不是強制性的。 該平台可以從外部獲得一個所謂的 PMML 模型規範,該規範是在不受平台控制的工具中訓練的——並從導入的那一刻起實時應用該模型 PMML規範. 同時,重要的是要考慮到並非所有 AI/ML 工件都可以簡化為 PMML 規範,即使大多數最常見的工件都允許這樣做。 因此,InterSystems IRIS 平台具有“開放循環”,並不意味著對用戶的“平台奴役”。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 20 Auto-ML 集成到基於 InterSystems IRIS 平台的 AI/ML 解決方案

我們列出了 InterSystems IRIS 的其他平台優勢(為清楚起見,與過程控制相關),這些優勢在人工智能自動化和實時機器學習中非常重要:

  • 與任何數據源和消費者(PCS/SCADA、設備、MRO、ERP 等)的高級集成工具
  • 內置的 多模型數據庫管理系統 用於任何數量的過程數據的高性能事務分析處理(混合事務/分析處理,HTAP)
  • 基於Python、R、Julia的實時AI/ML決策引擎持續部署開發工具
  • 用於實時 AI/ML 解決方案的持續集成和(自)學習機制的自適應業務流程
  • 用於可視化流程數據和 AI/ML 解決方案結果的嵌入式商業智能工具
  • API管理 將 AI / ML 解決方案的結果交付給過程控制系統 / SCADA、信息和分析系統、發送警報等。

基於 InterSystems IRIS 平台的 AI/ML 解決方案可輕鬆融入現有 IT 基礎設施。 InterSystems IRIS 平台通過支持容錯和容災配置以及在虛擬環境、物理服務器、私有和公共雲、Docker 容器中的靈活部署,提供高可靠性的 AI/ML 解決方案。

因此,InterSystems IRIS 是一個通用的實時 AI/ML 計算平台。 我們平台的普遍性在實踐中得到了證實,因為對實施計算的複雜性沒有事實上的限制,InterSystems IRIS 能夠(實時)結合來自各種行業的場景處理,以及出色的適應性平台的任何功能和機制以滿足特定用戶需求。

InterSystems IRIS - 通用實時 AI/ML 平台
圖 21 InterSystems IRIS - 通用實時 AI/ML 計算平台

為了與對此處介紹的材料感興趣的讀者進行更實質性的互動,我們建議您不要局限於閱讀它並繼續“現場”對話。 我們很樂意根據貴公司的具體情況為實時人工智能/機器學習場景的製定提供支持,在 InterSystems IRIS 平台上進行聯合原型設計,形成並實施引入人工智能和機器學習的路線圖進入您的生產和管理流程。 我們的 AI/ML 專家組的聯繫電子郵件地址是 [電子郵件保護].

來源: www.habr.com

添加評論