InterSystems IRIS 是一个通用实时 AI/ML 平台

作者:Sergey Lukyanchikov,InterSystems 咨询工程师

实时 AI/ML 计算调用

让我们从 InterSystems 数据科学实践经验的例子开始:

  • 加载的买家门户连接到在线推荐系统。 整个零售网络的促销活动将进行重组(例如,现在将使用“细分策略”矩阵,而不是“扁平”的促销活动)。 推荐引擎会发生什么? 向推荐引擎提交和更新数据会发生什么情况(输入数据量增加了25000倍)? 推荐的开发会发生什么情况(由于推荐规则的数量和“范围”增加了千倍,需要将推荐规则的过滤阈值降低千倍)?
  • 有一个系统可以监控设备组件出现缺陷的可能性。 自动化过程控制系统与监控系统相连,每秒传输数千个工艺过程参数。 之前“手动采样”的监测系统会发生什么变化(是否能够提供逐秒的概率监测)? 如果输入数据中出现数百列的新块,其中来自最近添加到过程控制系统的传感器的读数会发生什么(是否有必要停止监控系统以将来自新传感器的数据纳入分析) )?
  • 创建了一套人工智能/机器学习机制(推荐、监控、预测),利用彼此的工作结果。 每月需要多少工时才能使该综合体的运行适应输入数据的变化? 当管理决策综合体支持时,一般的“减速”是多少(其中新支持信息的出现频率相对于新输入数据的出现频率)?

总结这些和许多其他示例,我们得出了实时使用机器学习和人工智能机制时出现的挑战的公式:

  • 我们对公司 AI/ML 开发的创建和适应(适应不断变化的情况)的速度感到满意吗?
  • 我们使用的 AI/ML 解决方案在多大程度上支持实时业务管理?
  • 我们使用的人工智能/机器学习解决方案是否能够独立(无需开发人员)适应数据和业务管理实践的变化?

我们的文章全面概述了 InterSystems IRIS 平台的功能,包括对 AI/ML 机制部署的普遍支持、AI/ML 解决方案的组装(集成)以及 AI/ML 解决方案的密集训练(测试)。数据流。 在本文中,我们将研究市场研究、人工智能/机器学习解决方案的案例研究,以及我们所谓的实时人工智能/机器学习平台的概念方面。

我们从调查中了解到:实时应用

结果 调查Lightbend 于 800 年对近 2019 名 IT 专业人士进行了一项调查,结果不言而喻:

InterSystems IRIS 是一个通用实时 AI/ML 平台
图1 实时数据的主要消费者

让我们在翻译中引用有关本次调查结果的报告的重要片段:

“......用于集成数据流并同时支持容器计算的工具的流行趋势,为市场对更灵敏、更合理、更动态的有效解决方案提出的要求提供了协同响应。 流数据传输信息的速度比传统分组数据更快。 除此之外,还能够快速应用计算方法,例如基于人工智能/机器学习的建议,通过提高客户满意度创造竞争优势。 敏捷性竞赛还影响 DevOps 范式中的所有角色 - 使应用程序开发和部署更加高效。 ……八百零四名 IT 专业人员提供了有关其组织中数据流使用的信息。 受访者主要位于西方国家(41% 在欧洲,37% 在北美),几乎均匀分布在小型、中型和大型公司之间。 ...

......人工智能不是炒作。 已经在生产力 AI/ML 应用程序中使用数据流处理的人中,有 XNUMX% 确认他们对 AI/ML 的使用将在明年实现最大增长(与其他应用程序相比)。

  • 大多数受访者认为,明年人工智能/机器学习场景中数据流的使用将出现最大增长。
  • AI/ML 中的应用将会增长,不仅因为相对较新的场景类型,还因为越来越多地使用实时数据的传统场景。
  • 除了 AI/ML 之外,物联网数据管道用户的热情也令人印象深刻 - 48% 已经集成物联网数据的用户表示,在不久的将来,针对这些数据的场景实施将会显着增加。 ……”

从这项相当有趣的调查中可以明显看出,机器学习和人工智能场景作为数据流消费的领导者的观念已经“正在路上”。 但同样重要的观察是通过 DevOps 的视角对实时 AI/ML 的感知:在这里,我们已经可以开始谈论“具有完全可访问数据集的一次性 AI/ML”仍然占主导地位的文化的转变。

实时 AI/ML 平台概念

实时 AI/ML 的一个典型应用领域是制造过程控制。 使用她的例子并考虑到之前的想法,我们将制定实时 AI/ML 平台的概念。
在过程控制中使用人工智能和机器学习具有许多特点:

  • 集中接收有关工艺过程状态的数据:频率高且参数范围广(过程控制系统每秒传输多达数万个参数值)
  • 相反,关于缺陷识别的数据,更不用说关于缺陷发展的数据,是稀缺和不规则的,其特点是缺陷的典型化及其及时定位(通常以纸质记录表示)
  • 从实践的角度来看,只有源数据的“相关性窗口”可用于模型的训练和应用,反映工艺过程在合理滑动区间内的动态,以工艺参数的最后读取值结束

这些特征迫使我们除了实时接收和基本处理工艺流程中密集的“宽带输入信号”外,还要(并行)对人工智能结果进行应用、训练和质量控制/机器学习模型 - 也是实时的。 我们的模型在相关性滑动窗口中“看到”的“框架”不断变化——随之而来的是,过去在其中一个“框架”上训练的人工智能/机器学习模型的工作结果的质量也会发生变化。 如果AI/ML模型的工作结果质量恶化(例如:“警报规范”分类误差的值超出了我们定义的限制),则应自动启动模型的额外训练更新的“框架” - 以及启动模型额外训练的时机的选择应考虑训练本身的持续时间,以及当前版本模型工作质量恶化的动态(因为在模型训练期间继续使用模型的当前版本,直到形成“新训练的”版本)。

InterSystems IRIS 拥有关键平台功能,可实现实时过程控制的 AI/ML 解决方案。 这些功能可分为三个主要组:

  • 将新的或改编的现有 AI/ML 机制持续部署(持续部署/交付,CD)到 InterSystems IRIS 平台上实时运行的高效解决方案中
  • 持续集成 (CI) 到传入技术流程数据流、用于 AI/ML 机制的应用/培训/质量控制的数据队列以及与数学建模环境交换数据/代码/控制操作的单一高效解决方案中,实时编排平台 InterSystems IRIS
  • AI/ML 机制的持续(自我)训练(Continously Training,CT),在数学建模环境中使用 InterSystems IRIS 平台传输的数据、代码和控制操作(“做出的决策”)进行

将与机器学习和人工智能相关的平台功能准确地划分为这些组并非偶然。 让我们引用方法论 出版物 谷歌为这种分类提供了概念基础,在我们的翻译中:

“……现在流行的DevOps概念涵盖了大规模信息系统的开发和运营。 实施此概念的优点是缩短开发周期的持续时间、更快地部署开发以及发布计划的灵活性。 为了实现这些好处,DevOps 涉及至少两种实践的实施:

  • 持续集成(CI)
  • 持续交付 (CD)

这些实践也适用于 AI/ML 平台,以确保高效的 AI/ML 解决方案的可靠且高性能的组装。

AI/ML平台与其他信息系统的不同之处在于:

  • 团队能力:在创建人工智能/机器学习解决方案时,团队通常包括数据科学家或数据研究领域的“学术”专家,他们进行数据分析、开发和测试模型。 这些团队成员可能不是专业的高效代码开发人员。
  • 开发:AI/ML 引擎本质上是实验性的。 为了以最有效的方式解决问题,需要经历输入变量、算法、建模方法和模型参数的各种组合。 这种搜索的复杂性在于追踪“什么有效/什么无效”,确保事件的可重复性,以及重复实施的发展的概括。
  • 测试:测试 AI/ML 引擎需要比大多数其他开发更广泛的测试。 除了标准单元和集成测试之外,还测试数据有效性以及将模型应用于训练和控制样本的结果的质量。
  • 部署:AI/ML 解决方案的部署不仅限于使用一次训练模型的预测服务。 AI/ML 解决方案围绕执行自动化模型训练和应用的多级管道构建。 部署此类管道涉及将传统上由数据科学家手动执行的重要操作自动化,以便能够训练和测试模型。
  • 生产力:AI/ML 引擎可能缺乏生产力,不仅因为编程效率低下,还因为输入数据不断变化的性质。 换句话说,人工智能/机器学习机制的性能可能会由于比传统开发的性能更广泛的原因而下降。 这导致需要(在线)监控我们的 AI/ML 引擎的性能,以及在性能指标不符合预期时发送警报或拒绝结果。

AI/ML平台与其他信息系统类似,都需要持续代码集成、版本控制、单元测试、集成测试和持续开发部署。 然而,就 AI/ML 而言,存在几个重要的区别:

  • CI(持续集成)不再仅限于测试和验证已部署组件的代码 - 它还包括测试和验证数据以及 AI/ML 模型。
  • CD(Continously Delivery/Deployment,持续部署)并不局限于编写和发布包或服务,而是意味着一个用于AI/ML解决方案的组合、训练和应用的平台。
  • CT(Continuous Training,持续训练)是一个新元素【约。 文章作者:与 DevOps 传统概念相关的新元素,其中 CT 通常是持续测试],是 AI/ML 平台固有的,负责训练和应用 AI 机制的自主管理/ML 模型。 ……”

我们可以说,处理实时数据的机器学习和人工智能需要更广泛的工具和能力(从代码开发到数学建模环境的编排),所有功能和主题领域之间更紧密的集成,更有效的人员和组织组织。机器资源。

实时场景:识别给水泵缺陷的发展

继续以过程控制领域为例,考虑一个具体问题(我们一开始就已经提到过):我们需要根据过程参数值的流动来实时监控泵的缺陷发展情况​​​​以及维修人员关于已识别缺陷的报告。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 2 监控缺陷发展的问题表述

在实践中以这种方式提出的大多数任务的一个特点是,必须在各种类型的缺陷的偶发性和不规则性发生(和登记)的背景下考虑数据接收(APCS)的规律性和效率。 换句话说:来自过程控制系统的数据每秒到达一次,正确且准确,并且用化学铅笔在车间的普通笔记本上注明日期来记录缺陷(例如:“12.01 - 泄漏到封面中”从第三个轴承一侧”)。

因此,我们可以用以下重要限制来补充问题的表述:我们只有一个特定类型缺陷的“标签”(即,特定类型缺陷的示例由来自过程控制的数据表示)系统在特定日期 - 我们没有更多此类特定类型缺陷的示例)。 这种限制立即使我们超出了经典机器学习(监督学习)的范围,经典机器学习应该有很多“标签”。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图3 监控缺陷发展任务的澄清

我们能否以某种方式“增加”我们可以使用的唯一“标签”? 我们可以。 泵的当前状况通过与已登记缺陷的相似程度来表征。 即使不使用定量方法,在视觉感知层面,通过观察过程控制系统得出的数据值的动态,您已经可以学到很多东西:

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 4 给定类型缺陷“标记”背景下的泵状况动态

但在我们快速变化的场景中,视觉感知(至少目前)并不是最合适的“标签”生成器。 我们将使用统计测试评估当前泵状况与报告的缺陷的相似性。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 5 在缺陷“标签”的背景下对传入数据进行统计测试

统计测试确定从过程控制系统接收到的“流包”中工艺过程参数值的记录与某种类型缺陷的“标签”记录相似的概率。 作为应用统计测试的结果计算出的概率值(统计相似性指数)被转换为值0或1,成为正在检查相似性的数据包中的每个特定记录中的机器学习的“标签”。 也就是说,在通过统计测试处理新收到的泵状态记录包后,我们有机会 (a) 将此包添加到训练集中以训练 AI/ML 模型,以及 (b) 对泵状态记录包进行质量控制将模型用于此包时的当前版本。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 6 将机器学习模型应用于缺陷“标签”背景下的传入数据

在我们之前的一篇文章中 网络研讨会 我们展示并解释 InterSystems IRIS 平台如何允许您以持续执行业务流程的形式实施任何 AI/ML 机制,以监控建模结果的可靠性并调整模型参数。 当使用泵实现场景原型时,我们使用网络研讨会期间介绍的所有 InterSystems IRIS 功能 - 作为我们解决方案的一部分在分析器流程中实现,不是经典的监督学习,而是强化学习,它自动管理训练模型的选择。 训练样本包含在应用统计测试和模型的当前版本后产生“检测共识”的记录 - 即统计测试(在将相似性指数转换为 0 或 1 后)和模型产生结果1. 在模型的新训练过程中,在其验证过程中(将新训练的模型应用于自己的训练样本,并对其进行初步统计测试),记录处理后“未保留”结果 1通过统计测试(由于在训练中不断存在来自缺陷的原始“标签”的记录样本),从训练集中删除,并且新版本的模型从缺陷的“标签”中学习缺陷加上流中“保留”的记录。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 7 InterSystems IRIS 中 AI/ML 计算的自动化

如果需要对 InterSystems IRIS 本地计算期间获得的检测质量提供某种“第二意见”,则会创建一个顾问流程,以使用云服务(例如 Microsoft Azure、亚马逊网络服务、谷歌云平台等):

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 8 由 InterSystems IRIS 精心策划的 Microsoft Azure 的第二意见

InterSystems IRIS 场景的原型被设计为一个基于代理的分析过程系统,与设备对象(泵)、数学建模环境(Python、R 和 Julia)交互,并确保所有涉及的 AI/ ML 机制 - 基于实时数据流。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 9 InterSystems IRIS 中实时 AI/ML 解决方案的主要功能

我们原型的实际结果:

  • 模型识别的缺陷样本(12 月 XNUMX 日):

InterSystems IRIS 是一个通用实时 AI/ML 平台

  • 模型识别出的正在形成的缺陷未包含在样本中(11 月 13 日,仅两天后,即 XNUMX 月 XNUMX 日,修复团队就识别出了该缺陷本身):

InterSystems IRIS 是一个通用实时 AI/ML 平台
对包含同一缺陷的多个事件的真实数据进行的模拟表明,我们在 InterSystems IRIS 平台上实施的解决方案使我们能够在修复团队检测到此类缺陷之前几天识别出此类缺陷的发展情况。

InterSystems IRIS - 通用实时 AI/ML 计算平台

InterSystems IRIS 平台简化了实时数据解决方案的开发、部署和运营。 InterSystems IRIS 能够同时执行交易和分析数据处理; 支持根据多种模型(包括关系、层次、对象和文​​档)同步数据视图; 充当集成各种数据源和个人应用程序的平台; 提供对结构化和非结构化数据的高级实时分析。 InterSystems IRIS 还提供使用外部分析工具的机制,并允许灵活组合云托管和本地服务器托管。

基于 InterSystems IRIS 平台构建的应用程序部署在各个行业,帮助企业从战略和运营角度实现显着的经济效益,增强明智的决策并弥合事件、分析和行动之间的差距。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 10 实时 AI/ML 背景下的 InterSystems IRIS 架构

与上图一样,下图将新的“坐标系”(CD/CI/CT)与平台工作元素之间的信息流图结合在一起。 可视化从宏观机制 CD 开始,并继续到宏观机制 CI 和 CT。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 11 InterSystems IRIS 平台的 AI/ML 元素之间的信息流图

InterSystems IRIS 中 CD 机制的本质是:平台用户(AI/ML 解决方案的开发人员)使用 AI/ML 机制的专用代码编辑器:Jupyter(全称:Jupyter Notebook;为简洁起见,有时也称为在此编辑器中创建的文档)。 在 Jupyter 中,开发人员有机会在将特定 AI/ML 开发放置(“部署”)到 InterSystems IRIS 中之前编写、调试和验证其性能(包括使用图形)。 很明显,以这种方式创建的新开发将仅接受基本的调试(特别是因为 Jupyter 不能处理实时数据流) - 这是按顺序进行的,因为 Jupyter 中开发的主要结果是对单独的人工智能/机器学习机制的基本可操作性的确认(“显示数据样本的预期结果”)。 同样,在 Jupyter 中调试之前已经放置在平台中的机制(请参阅以下宏机制)可能需要“回滚”到“平台前”形式(从文件中读取数据,通过 xDBC 而不是表处理数据,与全局直接交互 - 多维数据数组 InterSystems IRIS – 等)。

InterSystems IRIS 中 CD 实现的一个重要方面:在平台和 Jupyter 之间实现了双向集成,允许将 Python、R 和 Julia 中的内容传输到平台(并随后在平台中进行处理)(这三者都是编程)相应领先开源语言中的语言)。源数学建模环境)。 因此,AI/ML 内容开发人员有机会在平台中对此内容进行“持续部署”,在熟悉的 Jupyter 编辑器中工作,使用 Python、R、Julia 中提供的熟悉的库,并执行基本调试(如有必要)平台外。

让我们继续讨论 InterSystems IRIS 中的 CI 宏机制。 该图显示了“实时机器人化器”(由它们用数学语言和 ObjectScript(InterSystems IRIS 的本机开发语言)编排的数据结构、业务流程和代码片段的复合体)的宏观流程。 这个宏观过程的任务是维护AI/ML机制运行所需的数据队列(基于实时传输到平台的数据流),对应用程序的顺序和AI/ML的“分类”做出决策。机器学习机制(它们也是“数学算法”、“模型”等——可以根据实现的具体情况和术语偏好进行不同的称呼),使数据结构保持最新状态,以分析人工智能/工作的结果ML 机制(多维数据集、表格、多维数据数组等)。等等 – 用于报告、仪表板等)。

InterSystems IRIS 中 CI 实施的一个重要方面是:在平台和数学建模环境之间实现了双向集成,允许您在各自的环境中以 Python、R 和 Julia 执行平台中托管的内容并接收执行结果。 这种集成以“终端模式”(即,AI/ML 内容被制定为调用环境的 ObjectScript 代码)和“业务流程模式”(即,AI/ML 内容被制定为业务流程)来实现。使用图形编辑器,有时使用 Jupyter,或使用 IDE(IRIS Studio、Eclipse、Visual Studio Code)。 Jupyter 中编辑业务流程的可用性通过 CI 级别的 IRIS 和 CD 级别的 Jupyter 之间的连接反映出来。 下面提供了与数学建模环境集成的更详细概述。 我们认为,现阶段有充分理由确保该平台拥有将 AI/ML 开发(来自“持续部署”)“持续集成”到实时 AI/ML 解决方案的所有必要工具。

以及主要的宏观机制:CT。 没有它,就不会有AI/ML平台(尽管“实时”将通过CD/CI来实现)。 CT的本质是平台直接在数学建模环境的工作会话中使用机器学习和人工智能的“工件”:模型、分布表、矩阵向量、神经网络层等。 在大多数情况下,这种“工作”包括在环境中创建提到的工件(例如,在模型的情况下,“创建”包括设置模型的规范以及随后选择其参数值 -所谓的模型“训练”)、它们的应用(对于模型:借助目标变量的“模型”值进行计算 - 预测、类别成员资格、事件概率等)以及已有的改进创建并应用工件(例如,根据应用结果重新定义一组模型输入变量 - 以提高预测准确性,作为一种选择)。 理解 CT 作用的关键点是它对 CD 和 CI 现实的“抽象”:CT 将实现所有工件,重点关注特定环境提供的功能内的 AI/ML 解决方案的计算和数学细节。 “提供投入”和“交付产出”将由 CD 和 CI 负责。

CT 实施的一个重要方面,特别是在 InterSystems IRIS 中:使用上面已经提到的与数学建模环境的集成,该平台能够从在其控制下在数学环境中运行的工作会话中提取这些工件,并且(最重要的是)将它们转化为平台数据对象。 例如,刚刚在工作 Python 会话中创建的分布表可以(无需停止 Python 会话)以全局(多维 InterSystems IRIS 数据数组)的形式传输到平台 - 并使用用于另一种 AI/ML 机制中的计算(用另一种环境的语言实现 - 例如,在 R 中) - 或虚拟表。 另一个例子:与模型运行的“正常模式”(在Python工作会话中)并行,对其输入数据进行“自动机器学习”:自动选择最佳输入变量和参数值。 除了“常规”训练之外,高效模型还实时收到其规范的“优化建议” - 其中输入变量集发生变化,参数值发生变化(不再是训练的结果)在 Python 中,但作为使用其自身的“替代”版本(例如 H2O 堆栈)进行训练的结果,允许整体 AI/ML 解决方案自主应对输入数据和正在建模的现象的性质的意外变化。

让我们通过现实原型的示例来更详细地了解 InterSystems IRIS 的平台 AI/ML 功能。

下图中,幻灯片左侧有一部分业务流程,实现了Python和R脚本的执行。中间部分分别是其中一些脚本执行的可视化日志, Python 和 R 语言。紧随其后的是一种或另一种语言的内容示例,被传输到适当的环境中执行。 右边最后是基于脚本执行结果的可视化。 顶部的可视化是在 IRIS Analytics 上进行的(数据从 Python 提取到 InterSystems IRIS 数据平台并使用该平台显示在仪表板上),底部的可视化是直接在 R 工作会话中进行的,并从那里输出到图形文件。 一个重要方面:原型中呈现的片段负责根据在模型应用期间观察到的分类质量监控过程的命令,根据从设备模拟器过程实时接收的数据来训练模型(设备状态的分类)。 将进一步讨论以一组交互过程(“代理”)的形式实现 AI/ML 解决方案。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 12 InterSystems IRIS 中与 Python、R 和 Julia 的交互

平台流程(它们也是“业务流程”、“分析流程”、“管道”等 - 取决于上下文)首先在平台本身的图形业务流程编辑器中进行编辑,并以这样的方式进行编辑。其框图和相应的 AI/ML 机制(程序代码)同时创建。 当我们说“获得一种 AI/ML 机制”时,我们最初指的是混合性(在一个进程内):数学建模环境语言中的内容与 SQL 中的内容相邻(包括来自 SQL 的扩展) 集成机器学习),在 InterSystems ObjectScript 中,以及其他受支持的语言。 此外,平台流程以分层嵌套片段的形式提供了非常广泛的“渲染”机会(如下图示例所示),这使您可以有效地组织甚至非常复杂的内容,而不会“脱落”图形格式(转换为“非图形”格式)。» 方法/类/过程等)。 也就是说,如果有必要(并且在大多数项目中都预见到),绝对可以以图形自记录格式实现整个 AI/ML 解决方案。 请注意,在下图的中心部分,它代表了更高的“嵌套级别”,很明显,除了训练模型的实际工作(使用Python和R)之外,还分析了所谓的添加了训练模型的 ROC 曲线,允许以视觉方式(也可以通过计算方式)评估训练质量 - 并且此分析是用 Julia 语言实现的(相应地,在 Julia 数学环境中执行)。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 13 InterSystems IRIS 中 AI/ML 解决方案组成的可视化环境

如前所述,平台中已实现的 AI/ML 机制的初始开发和(在某些情况下)改编将/可以在平台外部的 Jupyter 编辑器中完成。 在下图中,我们看到了一个调整现有平台流程的示例(与上图相同)——这就是 Jupyter 中负责训练模型的片段的样子。 Python 内容可直接在 Jupyter 中进行编辑、调试和图形输出。 可以通过即时同步到平台流程(包括其生产版本)来进行更改(如有必要)。 新的内容可以通过类似的方式传输到平台(自动生成新的平台流程)。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图14 使用Jupyter Notebook编辑InterSystems IRIS平台中的AI/ML引擎

平台流程的适应不仅可以以图形或笔记本电脑格式执行,还可以以“完整”IDE(集成开发环境)格式执行。 这些 IDE 是 IRIS Studio(本机 IRIS studio)、Visual Studio Code(VSCode 的 InterSystems IRIS 扩展)和 Eclipse(Atelier 插件)。 在某些情况下,开发团队可以同时使用所有三个 IDE。 下图显示了在 IRIS studio、Visual Studio Code 和 Eclipse 中编辑相同流程的示例。 绝对所有内容都可以编辑:Python/R/Julia/SQL、ObjectScript 和业务流程。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 15 InterSystems IRIS 业务流程在各种 IDE 中的开发

用业务流程语言 (BPL) 描述和执行 InterSystems IRIS 业务流程的工具值得特别提及。 BPL 使得在业务流程中使用“现成的集成组件”(活动)成为可能 - 事实上,这完全有理由说“持续集成”是在 InterSystems IRIS 中实现的。 现成的业务流程组件(它们之间的活动和连接)是组装 AI/ML 解决方案的强大加速器。 不仅仅是组件:由于它们之间通过不同的人工智能/机器学习开发和机制进行的活动和联系,出现了一个“自主管理层”,能够根据情况实时做出决策。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 16 InterSystems IRIS 平台上用于持续集成 (CI) 的现成业务流程组件

代理系统(也称为“多代理系统”)的概念在机器人化领域具有重要地位,InterSystems IRIS 平台通过“产品流程”结构有机地支持它。 除了为每个流程“填充”整体解决方案所需的功能的无限可能性之外,赋予平台流程系统以“代理”属性,使您能够为极其不稳定的模拟现象(社交/行为)创建有效的解决方案。生物系统、部分可观察的技术过程等)。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 16 AI/ML 解决方案作为 InterSystems IRIS 中基于代理的业务流程系统的运行

我们继续对 InterSystems IRIS 进行回顾,并讲述一个关于应用该平台解决整类实时问题的故事(对 InterSystems IRIS 上平台 AI/ML 的一些最佳实践的相当详细的介绍可以在我们之前的 网络研讨会).

继上图之后,下面是代理系统的更详细的图。 该图显示了相同的原型,所有四个代理进程都是可见的,它们之间的关系示意性地绘制:GENERATOR - 处理设备传感器创建数据,BUFFER - 管理数据队列,ANALYZER - 执行机器学习本身,MONITOR - 监控机器学习的质量,并提交有关需要重新训练模型的信号。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 17 InterSystems IRIS 中基于代理的业务流程系统形式的 AI/ML 解决方案的组成

下图说明了另一个机器人原型(识别文本的情感色彩)一段时间的自主功能。 上半部分是模型训练质量指标的演变(质量在增长),下半部分是模型应用质量指标的动态和重复训练的事实(红色条纹)。 正如您所看到的,该解决方案已高效、自主地进行自我学习,并在给定的质量水平上运行(质量分值不低于 80%)。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 18 InterSystems IRIS 平台上的连续(自)训练 (CT)

我们之前也提到过“自动机器学习”,但下图使用另一个原型的示例详细展示了此功能的使用。 业务流程片段的图形显示了在 H2O 堆栈中触发建模的活动,显示了该建模的结果(根据以下比较图,结果模型相对于“人造”模型的明显优势) ROC 曲线,以及自动识别原始数据集中可用的“最有影响力的变量”)。 这里重要的一点是通过“自动机器学习”节省了时间和专家资源:我们的平台流程在半分钟内完成的工作(查找和训练最佳模型)可能需要专家一周到一个月的时间。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 19 将“自动机器学习”集成到 InterSystems IRIS 平台上的 AI/ML 解决方案中

下图有点没有抓住重点,但它是结束正在解决的实时问题类别的故事的一个好方法:我们提醒您,凭借 InterSystems IRIS 平台的所有功能,在其控制下的训练模型是不是强制性的。 该平台可以从外部接收模型的所谓 PMML 规范,并在不受平台控制的工具中进行训练 - 并从导入该模型的那一刻起实时应用该模型 PMML规范。 重要的是要考虑到,并非所有 AI/ML 工件都可以简化为 PMML 规范,即使大多数最常见的工件允许这样做。 因此,InterSystems IRIS 平台是“开环”的,并不意味着用户的“平台奴役”。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 20 将“自动机器学习”集成到 InterSystems IRIS 平台上的 AI/ML 解决方案中

让我们列出 InterSystems IRIS 的其他平台优势(为了清楚起见,与过程控制相关),这些优势对于人工智能和实时机器学习的自动化非常重要:

  • 开发与任何数据源和消费者的集成工具(过程控制系统/SCADA、设备、MRO、ERP 等)
  • 内建的 多模型数据库管理系统 用于任意数量的技术流程数据的高性能事务和分析处理(混合事务/分析处理,HTAP)
  • 用于持续部署 AI/ML 引擎的开发工具,用于基于 Python、R、Julia 的实时解决方案
  • 用于持续集成和(自)学习实时 AI/ML 解决方案引擎的自适应业务流程
  • 内置商业智能工具,用于可视化流程数据和 AI/ML 解决方案的结果
  • API管理 用于将 AI/ML 解决方案的结果传递给过程控制系统/SCADA、信息和分析系统、发送警报等。

InterSystems IRIS 平台上的 AI/ML 解决方案可轻松融入现有 IT 基础设施。 InterSystems IRIS平台通过支持容错和容灾配置以及在虚拟环境、物理服务器、私有云和公共云以及Docker容器中的灵活部署,确保AI/ML解决方案的高可靠性。

因此,InterSystems IRIS 是一个通用的实时 AI/ML 计算平台。 我们平台的通用性在实践中得到了证实,因为对执行计算的复杂性没有事实上的限制,InterSystems IRIS 结合(实时)处理来自各种行业的场景的能力,以及卓越的适应性任何平台功能和机制都可以满足用户的特定需求。

InterSystems IRIS 是一个通用实时 AI/ML 平台
图 21 InterSystems IRIS - 通用实时 AI/ML 计算平台

为了与对此处提供的材料感兴趣的读者进行更实质性的互动,我们建议您不要局限于阅读它并继续“现场”对话。 我们很乐意根据您公司的具体情况提供制定实时 AI/ML 场景的支持,在 InterSystems IRIS 平台上进行联合原型设计,制定并在实践中实施引入人工智能和机器学习的路线图融入您的生产和管理流程。 我们的 AI/ML 专家团队联系电子邮件 – [电子邮件保护].

来源: habr.com

添加评论