视频分析结合:大脑和机器如何处理我们的脸

视频分析结合:大脑和机器如何处理我们的脸

看到并快速识别面孔的能力是一种超能力。 无需浪费时间进行分析、研究皱纹、褶皱和椭圆形。 面部识别即时且轻松。 这太容易了,以至于我们没有意识到我们是如何做到的。

想想不同的面孔彼此之间有多么相似——两只眼睛、一张嘴、一个鼻子、两侧伸出的耳朵,每次都以相同的顺序(最常见)。 我们如此轻松地分析一个物体真是令人难以置信。

我们从出生起就被“编程”为识别面孔,但现在人们做得更好——他们教会了机器这项技能。 个人识别和识别系统的广泛引入将如何影响社会生活?

Pareidolia:自动面部搜索

视频分析结合:大脑和机器如何处理我们的脸

处于“自动”模式的人能够区分任何表面上熟悉的图像。 该建筑只有三个建筑元素被视为一只惊讶的鸭子的脸。 这是幻想性幻想的一个例子。

Pareidolia 这个词来自希腊语 para(para - 接近、大约、偏离某物)和 eidolon - 图像。 这是视错觉的名称,即对实际上不存在的图像或意义的感知。 例如,树干上的脸或云中的动物形象就是幻想性视错觉。

视频分析结合:大脑和机器如何处理我们的脸
更多类似的照片可以在 thingswithfaces.com 上找到

我们在其中看到人和动物的面孔 任何 几何图形。 整个表情符号文化都是建立在这个原则之上的。 🙂

视频分析结合:大脑和机器如何处理我们的脸

空想性幻想现象可以很容易地转化为算法语言。 艺术家 金容勋新胜拜 使用 OpenCV 库的脚本拍摄云朵瞬间融入人脸的照片。

撒切尔错觉:系统性生物学错误

视频分析结合:大脑和机器如何处理我们的脸

有一个生物错误表明 识别能力更加重要。 您周围的大多数物体(椅子、桌子、电脑)都可以从任何角度轻松看到并正确识别。 只是不是脸。

倒立的脸会导致大脑出现故障,称为撒切尔效应(错觉)。 这种现象描述了一种很难检测倒置肖像照片中局部变化的情况。

让我们把玛格丽特·撒切尔的照片翻过来看看结果。视频分析结合:大脑和机器如何处理我们的脸

第一张照片看起来很正常,但如果你把它翻过来,眼睛和嘴巴的错误位置立即引起你的注意。 人和人工神经网络对图像的感知不同。 令人惊奇的是,我们耳朵之间的“神经网络”是如此容易被愚弄。

撒切尔错觉展示了我们大脑处理信息的一些基本机制。 大脑读取单个元素的集合:一双眼睛、一个鼻子、一张嘴和耳朵。 除了面部特征的个体特征外,还考虑它们之间的关系和位置。 也就是说,面部被视为一个完整的系统。

因此,当我们看到一张颠倒的脸时,大脑更难以从整体上评估图像——每个元素的信息都是单独“收集”的:眼睛在适当的位置,嘴巴看起来像嘴巴。 然而,一旦我们看到正确的面孔,对单个系统的感知就会突然重新连接,问题就开始出现:很明显,常见的功能以一种不寻常的方式相互关联。

它为什么如此重要? 由于感知的完整性,人脑能够识别面部特征的最细微差异。 大脑皮层的一个区域识别面部并确定凝视的方向,杏仁核和岛叶分析面部表情,额叶前额区的一个区域和大脑的愉悦系统评估其美感。

Bug 作为特征:切尔诺夫的面孔

视频分析结合:大脑和机器如何处理我们的脸
(с)

利用人类感知的特征,利用“人脸”来分析聚合的多维数据。 美国数学家赫尔曼·切尔诺夫 (Herman Chernov) 于 1973 年概述了使用“面孔”来识别特征依赖性并探索多个变量之间的复杂关系的概念。

切尔诺夫的数据以面部象形图的形式体现,其中所选变量的相对值呈现为各个特征的形状和大小:鼻子长度、眉间角度、面部宽度——总共多达36个变量。 因此,观察者可以识别对于每个值配置而言唯一的对象的视觉特征。

快速浏览由面孔组成的图表,您可以快速确定轮廓的特征是否显着不同(一致)。 通过对面部特征的详细审查,哪些特征(每个面部特征是原始数据集的单独特征)相似、哪些不同就变得清晰起来。 例如,在上图中,通过悲伤和快乐的表情符号很容易注意到国家之间的差异。

为什么汽车需要你的脸?

视频分析结合:大脑和机器如何处理我们的脸

快速面部识别技能可以帮助您正确、恰当地接孩子放学、选择伴侣、表达情绪。 但是当一个人将这种能力转移到人工神经网络时会发生什么?

这个想法可能会令人反感。 并不是每个人都准备好轻松接受存储数据、监控运动、分析购买和情绪的技术。 从简单的视频监控到个性化视频分析的转变需要责任的显着增加。

视频分析结合:大脑和机器如何处理我们的脸

如今的算法如 深脸 检测面部相似度的准确度高于人类。 英伟达的算法可以在短短几秒钟内创建出不存在的人的面孔。 上面拼贴画中的面孔 产生的 StyleGAN 神经网络,在 70 张图像的数据集上进行训练。 它们看起来逼真得可怕。

视频分析结合:大脑和机器如何处理我们的脸
SearchFace算法演示

起初,Facebook 的面部识别算法引起了人们的警惕性提高,但后来大家都习惯了(或者离开了社交网络)。 VKontakte 上通过照片搜索人物的 FindFace 服务收到了不同的反应,并被用于欺凌,但类似的 SearchFace 项目的关闭已经引起了用户的负面反应 - 毕竟,如果数据可用,那就让它开放给大家。

零售连锁店正在安装面部识别技术来防止盗窃,收集顾客的年龄、性别甚至情绪数据。 归根结底,我们的目标是改善客户体验并从中赚钱。 当客户意识到该系统对他们个人有利时,许多人会同意实施新技术。

随着“身份盗窃”(信用卡和身份欺诈)案件的增加,消费者将更喜欢在需要时随时可用的系统。 正确识别它们。

目前,算法有助于解决弱光镜框、低分辨率和伪装的问题,例如眼镜、假发和多日胡茬。 该系统运行速度惊人,只需一秒钟即可将一张脸与数百万人的数据库进行匹配。

美国的一些商店 提供 盗窃嫌疑人有一个选择:允许自己被拍照或被正式指控犯罪。 小偷获得了自由,并被禁止访问商店,他的照片也被正式纳入数据库。 包含人物图像的文件经过加密,只有系统所有者才能访问。

谁从认可中获益?

播放视频

大多数商店已经安装了闭路电视摄像机。 对于视频分析,不需要更新硬件 - 只需连接到云服务即可。 借助 Ivideon 视频分析服务,几乎没有任何进入障碍。 解决方案成本 每台相机 1 卢布起,任何企业家都可以使用该软件。

零售商使用面部识别技术的主要动机是防止盗窃。 根据 数据 根据国家零售基金会的数据,仅在美国,1,33 年就有约 2017% 的商品因盗窃而丢失,损失不少于 46,8 亿美元。

面部识别技术可减少 30% 以上的入店行窃行为。

损坏的程度通常受到次要因素的影响:员工的疏忽、安全服务培训不足、想要省钱。 这些问题和其他问题必须使用摄像头和云技术来解决。

面部识别系统有助于快速处理“黑”名单:它将客户的照片与不可靠面孔的数据库进行比较,如果匹配,则向保安人员发送相应的警告。

分析软件显着增强了商店的安全性。 经验丰富的小偷能够注意到摄像机的“盲点”。 在这种情况下,警卫可以使用手机拍摄嫌疑人的照片,然后检查该人是否在数据库中。

品牌长期以来一直在使用移动营销——发送短信、推送通知和展示有针对性的广告。 对于传统零售业来说,识别系统提供的机会与在线卖家通过 cookie 获得的机会相同。

用于识别小偷的同一个平台正在帮助零售商找出哪些店面更能吸引购物者。 识别系统有助于在商店入口处识别 VIP 客户。 使用 CRM 中的数据,卖方可以快速向客户提供有利可图的报价。

视频分析结合:大脑和机器如何处理我们的脸
在首尔国际金融中心,信息台上的实时摄像头 确定 该人的年龄和性别,并根据确定的参数提供广告

客户信息激活了增加销售额和评估受众需求的强大工具。 这些摄像头将帮助您根据特定访客的性别、年龄和情绪状态定制视频广告的显示,也将成为计算广告效果的数据提供者。

零售商的上述机会听起来常常像是烦人的广告噪音。 关于“利润增长”和“受众需求”的论文伴随着市场上的任何 IT 工具——从 ERP 到电子价格标签。 面部识别系统除了人工智能和未来技术的纯粹营销之外还有更多意义吗? 让我们通过在现有商店中使用真实系统的示例来回答这个问题。

“在现场工作”:谁能在真实条件下识别面孔

视频分析结合:大脑和机器如何处理我们的脸

7-36是全球最大的零售连锁店,在日本000-18管理下,在XNUMX个国家经营着超过XNUMX家小店。 近期该公司 已建立 11 家商店中的软件。 零售网络中的面部识别和行为分析技术用于识别忠诚卡持有者、监控顾客流量并确定仓库中的商品库存水平。

视频分析结合:大脑和机器如何处理我们的脸

Saks 是一家拥有百年历史的高端零售连锁店,目前由世界上最古老的公司之一(成立于 1670 年)哈德逊湾公司 (Hudson's Bay Company) 所有。 视频分析 使用 Saks主要是为了防盗。 该软件根据已知商店扒手的数据库检查可疑商店扒手的照片。 这些摄像机已联网,因此可以在纽约 Saks 总部查看结果。

据《卫报》报道,欧洲的高档商店和酒店经常使用面部识别技术来跟踪贵宾和名人,以确保他们获得最佳的体验。

视频分析结合:大脑和机器如何处理我们的脸

在美国,汉堡连锁店 CaliBurger 使用 忠诚度计划中的面部识别技术。 交互式信息亭可以“识别”顾客、记住订单并提供最喜欢的菜肴,并通过面部识别接受付款。

该系统消除了可能难以使用移动应用程序、奖励积分和信用卡的老年人参与奖励计划的障碍。

面部识别系统在亚洲广泛使用,尤其是在中国,它们被用来支付食品费用、从 ATM 机提取现金,甚至贷款。 中国人脸识别的准确度超过了人眼的能力。 这也得益于中国从2D识别大规模转向3D识别。

在第一种情况下,算法使用数据库中积累的二维图像进行分析。 3D 识别分析重建的 XNUMXD 图像并表现出更高的准确性。 在中国,面部扫描可用于购物(例如在肯德基支付订单)、付款和进入建筑物。

视频分析结合:大脑和机器如何处理我们的脸

至支付宝 需要微笑,让支付识别系统明白:面前的不是一张照片,而是一个活生生的人。 据称,不可能欺骗支付宝:改变发色、化妆或使用假发并不能改变任何东西。 该系统使用一组独特的特征,考虑到面部的几何形状及其上某些点的位置。

发现

西方企业和中国在人脸识别技术方面的直接投资规模巨大。 尽管如此,在俄罗斯实施此类项目只是时间问题。 大型商业公司已经了解其好处和经济影响。 如果我们将面部识别视为一种产品,那么重要的是要了解每个业务部门都有自己的具体情况,包括定价。 企业越大,可能需要更多的摄像头和分析模块。 大型企业的解决方案总是复杂的定制项目,定制需要额外的资金。 中小型企业只需一台带有连接面部识别模块的摄像头即可轻松应对。 在这种情况下,该解决方案的成本与使用云视频监控相当。

来源: habr.com