创世纪?)。 对心灵本质的反思。 第二部分

创世纪?)。 对心灵本质的反思。 第二部分

关于流程的一句话,或者我们所有人都知道一点 逆风.

关于自然智能和人工智能 (AI) 主题的思考延续,第一部分 这里


关于回填的问题: 请问这个人现在住吗? 不,当我们走在街上并直接思考周围的世界时,我们或多或少都会采取行动 即时的……虽然事实上——只要我们看到的东西经过了通常的识别/分类机制——这一切都将是最近发生的,但仍然是过去。 那些。 一个人活在过去吗?

例如:你走在街上,看到一只狗。 或者一辆车。 无论如何,如果我们谈论当下,这些信息就已经过时了。 如果我们使用经过我们所有认知机制的数据进行操作(大脑远不是最快的计算器!),我们根本无法跟上世界的步伐! 狗会攻击,或者相反,逃跑,你拍拍它耳后的愿望将无法实现,而汽车会撞到你或从你身边驶过,尽管你想“抓住”的是这辆车。

但感谢上帝,事情并没有这样发生,原因如下:大脑的工作方式不同。 感知的单位不是一个对象,甚至不是一组对象,而是过程。 狗在跑。 给你或来自你。 或者,例如,他没有跑,而是躺着。 汽车也是静止的(在停车场),或者朝某个方向移动。 在所有情况下,你都会感知到一个随着时间的推移而延伸的过程,因此,在未来会有一定的发展。 当我说我们认为事件是按时间展开的时,这并不是一个比喻。 进行一个实验 - 拍摄十几张照片(即现实的快照)并描述您所看到的内容。 这里有几个人在一个房间里,他们正在争吵,或者这是一个人在街上行走,或者这是一个人坐着看电视,而这是另一个人在读书。 这些都是时间上延长的过程! 您将快照视为具有扩展名的东西。 你不知道如何以其他方式做到这一点,因为这就是大脑的工作方式:它被训练来识别过程,而不是舞台上孤立的物体。 就像不是眼睛-鼻子-嘴巴,而是整个脸部(你好,卷积神经网络)。

世界由过程组成,而不是由物体组成。 如果我问你那是什么 яблоко,那么大多数成年人会说这是 水果和孩子们——这是什么? 食品。 但两者都是过程描述,因为第一个意味着这个苹果 长在树上,并为树的繁殖服务,第二个是它 食用。 两者都与苹果的直接特征(形状、颜色、大小)无关……因为这些特征允许识别,但不允许使用或了解它在外部世界的用途,即。 定义流程。

如果我们进行一场关于时间本质的典型辩论,那么经典的假设将是关于过去的不变性(在时间旅行的背景之外)、现在的重要性(只有一刻……😉),未来尚不存在,这意味着它可以改变。 当我们谈论客观现实时,很可能确实如此。 然而,一个人生活在他自己的、主观的世界模型中,那里的一切几乎是相反的!

过去并不像我们希望的那样一成不变。 一个人不断接收新的信息,重建过去以消除矛盾(你以为彼得·斯泰潘尼奇(Pyotr Stepanych)在研讨会上,而他是从脱衣舞俱乐部出来的……这意味着他,这位艺人,根本没有去…… )。 同时,你的主观未来在很多方面都是恒定的(不管是什么,周五我有啤酒和足球!)。 此外,如果未来有一个特定的目标,你不仅可以按相反的顺序构建流程链(想要成为大公司的董事,你需要从名牌大学毕业并获得文凭,为此你必须先入学,为此你需要通过国家统一考试,并学习你的功课!),但也很有可能在这个过程中你会回到过去(难道我们没有朋友/熟人现在已经上升并获得了联系并且可以帮助孩子上大学吗?) - 为什么不反情绪? 😉

不过,我有点离题了。 尽管如此,我想要关注的主要事情是 流程。 我深信潜在的人工智能不应该在照片甚至视频上进行训练。 卷积网络有两个级别(最小) - 事实上这是两个不同的网络:一个被训练以在原始图像中查找某些图形模式,第二个处理第一个网络的输出 - 即具有已经处理和准备的信息。 为了成功地与人工智能世界进行交互,需要同样的东西:在某些(绝不是第一)级别上,必须有一个网络接收随时间展开的过程图作为输入。 “开始”和“结束”、“运动”、“转变”、“合并”和“分裂”等概念是网络必须学习使用的。

我很确定那些从事游戏人工智能工作的人,比如 Alpha Go,都以某种方式理解这一点。 也许方法有些不同,但本质是相同的:对棋盘上的当前情况(以及最后几次走势的发展)进行分析,以了解“总体上发生的情况”。 根据发生的事情与应该发生的事情的对应程度,我们选择自己的行动。

当输入是来自传感器的图片时,很难谈论策略/行为。 反之亦然 - 正如实践所表明的那样,准备好的向量包含具有完整信息(考虑世界的完整图片)的游戏中当前领域状态的完整细分是一项完全可行的任务。 然而,如果第一级的卷积网络已经识别了对象,并且下一个级别动态地分析这些对象,识别补充之前获得的数据的过程(例如熟悉的训练过程),那么似乎可以使用它。 ..

向专家提问:

鉴于神经网络当前的发展,大约执行以下操作是否现实:

在入口,比方说连续视频信号,可能是立体声。 作为一个选项:具有多个自由度(能够任意或根据模式旋转相机)。 然而,如果有必要,视频信号可以通过任何其他空间感知方法(从声纳到激光雷达)来补充/替换。

严格来讲…输入可以是任何人 即时的 流程 - 甚至是语音/文本,甚至是货币报价,但是......在考虑的过程中,我更容易依赖唯一可供我直接研究的心灵样本 - 我自己的! )在这个“样本”中,感官通道是无与伦比的!
在出口处:

  1. 深度图(如果相机是静态的)或环境图。 空间(动态相机/激光雷达等);

    因此如果我们想要对物体进行真实的空间排列来评估它们的相互作用,这是必要的。 在这种情况下,来自相机的图像只是高维空间的二维投影,需要额外的变换。

  2. 单个对象的隔离(考虑深度/空间图,而不仅仅是/没有那么多可见轮廓);
  3. 移动物体的识别(速度/加速度、轨迹的构建/预测(?));
  4. 根据任何提取的特征(形状/尺寸/颜色/运动的细微差别/组成部分(?))对对象进行层次分类。 那些。 本质上是提取指标 希尔伯特空间.

    关于层次结构也许“等级制”这个词在这种情况下并不完全合适。 我想强调随时选择指标的能力,以便 海明加距离 它们之间的关系使我们能够将两组不同的指标视为一个概念。 例如,如何将“红色汽车”和“蓝色公交车”归纳为“车辆”的概念。

重要事项: 如果可能,系统不会经过预训练。 那些。 一些基本的东西可以被奠定(例如,第一层的卷积网络,用于突出轮廓/几何),但它必须学会选择对象,然后自己识别它们。

  • 最后,及时构建扫描(基于第 1,4 点,即考虑度量的空间图)(目前,在明显直接观察的时期的这个阶段),以便根据第 2 点进行分析-4,为了识别:过程/事件(本质上是 变化 时间步骤 3) 及其聚类分类(步骤 4)。

再次:从传感器的图像中,我们首先以更准备好的形式提取对世界的描述,根据提取的特征进行标记,并且不划分为像素,而是划分为对象。 然后我们扩展由物体组成的世界 及时 并收到 《世界的图画》 我们将其输入到下一个网络的输入,该网络的处理方式与前面的层处理感官图像的方式相同。 在突出显示对象轮廓的地方,现在将突出显示正在进行的过程的“轮廓”。 物体在空间中的相对位置类似于时间过程中的因果关系......类似的东西。

据推测,在此之后,系统应该能够通过其部分来识别进程(因为它能够识别仅具有其片段的图像,或者作为 根据模型写出文本的延续),因此,在时间上向前和向后预测它们,在两个方向上无限扩展第 5 步的模型。 此外,大概,有了对组成过程的了解,系统就可以从几个相关的局部过程中识别出更大的全局过程,从而识别出隐式的隐藏过程,它们是已识别的全局过程的组成部分,但不被直接感知。

最后一件事:未来系统的状态是固定的(其中只有希尔伯特度量的重要元素是固定的,对其余的非必要值进行自由解释)——网络是否能够“思考”出休息?

嗯,就是这样。 如果它是一个只给出两个不相关片段的图像,那么在某个样本上训练的网络能否完成一个“一致”的完整图像? 本例中的样本是来自经验的类似时间间隔,片段是当前和指定的状态。 结果:一个连贯的“故事”将彼此联系起来......

在我看来,这已经成为进一步实验的重要基础:

  • 如果可能/必要的话,将自己的行为纳入“历史”
  • “自然”因果模式优先于不受控制的随机排放(轮盘赌问题)
  • 某种形式的好奇心,即通过行动主动认知模式......等

PS我完全承认我刚刚发明了轮子,有知识的人很长时间以来一直在实践中应用这些原理。 😉 既然如此,我请您“探听”相关进展。 如果能详细描述这种方法的基本问题或解释为什么它原则上不起作用,那就太好了。

PPS 我知道这篇文章很粗糙,而且这个想法从一个跳到另一个,但我真的想问几个人这些问题(“向专家提问”部分),如果没有的话,这是很难做到的至少一些演示。 过去的文字 (我现在正在重新阅读它,并意识到它很难理解)它达到了它的目的:我收到了一些对我有价值的讨论......我希望这次也能起作用! 😉

来源: habr.com

添加评论