🥇L'analyse vidéo combine : ce que le cerveau et les machines font de nos visages

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

La capacité de voir et de reconnaître rapidement les visages est un super pouvoir. Il n'est pas nécessaire de perdre du temps en analyses, en étudiant les rides, les plis et les ovales. La reconnaissance faciale est instantanée et sans effort. C'est si simple que nous ne réalisons pas comment nous procédons.

Pensez à quel point les différents visages se ressemblent - deux yeux, une bouche, un nez, des oreilles qui dépassent sur les côtés, à chaque fois dans le même ordre (le plus souvent). C'est incroyable qu'on analyse un objet avec une telle facilité.

Nous sommes « programmés » pour reconnaître les visages dès la naissance, mais maintenant les gens ont fait mieux : ils ont enseigné cette compétence à la machine. Comment l’introduction généralisée de systèmes de reconnaissance et d’identification des personnes affectera-t-elle la vie de la société ?

Paréidolie : recherche automatique de visage

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Les personnes en mode « automatique » sont capables de distinguer des images familières sur n’importe quelle surface. Seuls trois éléments architecturaux du bâtiment sont perçus comme le visage d'un canard surpris. Ceci est un exemple de paréidolie.

Le mot pareidolia vient des mots grecs para (para - près, à propos, déviation de quelque chose) et eidolon - image. C’est le nom d’une illusion d’optique, la perception d’une image ou d’un sens là où il n’y en a pas. Par exemple, un visage sur un tronc d’arbre ou des figures d’animaux dans les nuages sont des paréidolies.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages
Plus de photos comme celle-ci peuvent être trouvées sur Thingswithfaces.com

Nous voyons des visages de personnes et des visages d'animaux dans tout figure géométrique. Toute la culture emoji est construite sur ce principe. 🙂

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Le phénomène de paréidolie peut facilement être traduit en langage algorithmique. Artistes Shinseungback Kimyonghun a photographié des nuages se fondant momentanément dans des visages humains à l'aide d'un script avec la bibliothèque OpenCV.

L'illusion Thatcher : erreurs biologiques systémiques

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Il y a un bug biologique qui montre plus grande importance de la compétence de reconnaissance. La plupart des objets qui vous entourent - une chaise, une table, un ordinateur - sont faciles à voir et à identifier correctement sous n'importe quel angle. Mais pas les visages.

Un visage inversé crée un dysfonctionnement dans le cerveau appelé effet Thatcher (illusion). Le phénomène décrit une condition dans laquelle il est difficile de détecter des changements locaux dans une photo de portrait à l'envers.

Retournons la photo de Margaret Thatcher et regardons le résultat. L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

La première photo semble normale, mais si vous la retournez, la mauvaise position des yeux et de la bouche attire immédiatement votre attention. Une personne et un réseau de neurones artificiels perçoivent les images différemment. Il est étonnant que le « réseau neuronal » entre nos oreilles soit si facile à tromper.

L'illusion Thatcher démontre certains des mécanismes de base par lesquels notre cerveau traite les informations. Le cerveau lit un ensemble d’éléments individuels : une paire d’yeux, un nez, une bouche et des oreilles. Outre les caractéristiques individuelles des traits du visage, leurs relations entre eux et leur emplacement sont pris en compte. Autrement dit, le visage est perçu comme un système intégral.

Ainsi, lorsqu'on nous montre un visage à l'envers, il est plus difficile pour le cerveau d'évaluer l'image dans son ensemble - les informations sont « collectées » séparément pour chaque élément : les yeux sont en place, la bouche ressemble à une bouche. Cependant, dès qu'on nous montre le bon visage, la perception d'un système unique se reconnecte soudainement et les problèmes commencent : il devient clair que les caractéristiques habituelles sont interconnectées d'une manière inhabituelle.

Pourquoi c'est important? Le cerveau humain est capable de reconnaître les moindres différences dans les traits du visage grâce à l’intégrité de la perception. Une zone du cortex cérébral reconnaît un visage et détermine la direction du regard, l'amygdale et l'insula analysent les expressions faciales, et une zone dans la zone préfrontale du lobe frontal et le système du plaisir du cerveau évalue sa beauté.

Bug en tant que fonctionnalité : les visages de Tchernov

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages
(с)

La caractéristique de la perception humaine est utilisée pour analyser des données multidimensionnelles agrégées à l'aide de « visages ». Le mathématicien américain Herman Chernov a présenté en 1973 le concept de l'utilisation de « visages » pour identifier les dépendances caractéristiques et explorer les relations complexes entre plusieurs variables.

Les données de Tchernov se reflètent sous la forme de pictogrammes faciaux, où les valeurs relatives des variables sélectionnées sont présentées sous forme de formes et de tailles de caractéristiques individuelles : longueur du nez, angle entre les sourcils, largeur du visage - jusqu'à 36 variables au total. Ainsi, l'observateur peut identifier les caractéristiques visuelles des objets qui sont uniques pour chaque configuration de valeurs.

Un rapide coup d'œil sur un schéma composé de faces permettra de déterminer rapidement si les caractéristiques des profils sont significativement différentes (coïncidentes). Avec un examen détaillé des caractéristiques du visage, il devient clair quelles caractéristiques (chaque caractéristique du visage est une caractéristique distincte de l'ensemble de données d'origine) sont similaires et lesquelles sont différentes. Par exemple, dans l’illustration ci-dessus, il est facile de remarquer la différence entre les pays grâce aux émoticônes tristes et heureuses.

Pourquoi une voiture a-t-elle besoin de votre visage ?

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

La compétence de reconnaissance faciale rapide vous aide à récupérer votre enfant à la maternelle, à choisir un partenaire et à exprimer ses émotions correctement et de manière appropriée. Mais que se passe-t-il lorsqu’une personne transfère cette capacité à un réseau neuronal artificiel ?

L’idée peut être repoussante. Tout le monde n’est pas prêt à accepter facilement une technologie qui stocke des données, surveille les mouvements, analyse les achats et les émotions. Le passage de la simple vidéosurveillance à l’analyse vidéo personnalisée implique une augmentation significative des responsabilités.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Aujourd'hui, des algorithmes tels que Visage profond détecter les similitudes faciales avec une précision supérieure à celle des humains. L'algorithme de Nvidia crée les visages de personnes inexistantes en quelques secondes seulement. Visages dans le collage ci-dessus généré Réseau neuronal StyleGAN, formé sur un ensemble de données de 70 000 images. Ils ont l’air terriblement réalistes.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages
Démonstration de l'algorithme SearchFace

Au début, l’algorithme de reconnaissance faciale de Facebook a provoqué une vigilance accrue, mais ensuite tout le monde s’y est habitué (ou a quitté le réseau social). Le service FindFace pour rechercher des personnes par photo sur VKontakte a reçu des réponses mitigées et a été utilisé à des fins d'intimidation, mais la fermeture d'un projet SearchFace similaire a déjà provoqué une réaction négative de la part des utilisateurs - après tout, si les données sont disponibles, alors laissez-les être ouvertes à tout le monde.

Les chaînes de vente au détail installent une technologie de reconnaissance faciale pour prévenir le vol, collecter des données sur l'âge, le sexe et même les émotions des clients. En fin de compte, l’objectif est d’améliorer l’expérience client et d’en tirer profit. Lorsque les clients réalisent que le système leur est personnellement bénéfique, beaucoup accepteront de mettre en œuvre de nouvelles technologies.

Avec l’augmentation des cas de « vol d’identité » – fraude à la carte de crédit et à l’identité –, les consommateurs préféreront un système disponible quand ils en ont besoin. les identifie correctement.

Actuellement, les algorithmes aident à résoudre les problèmes de montures à faible luminosité, de faible résolution et de camouflage, comme les lunettes, les perruques et les chaumes de plusieurs jours. Les systèmes fonctionnent à une vitesse incroyable et associent un visage à une base de données de millions de personnes en une seconde seulement.

Quelques magasins aux USA offre Les suspects de vol ont le choix : se laisser photographier ou être formellement accusés d'un crime. Le voleur obtient la liberté, l'interdiction de visiter le magasin et sa photo est officiellement incluse dans la base de données. Les fichiers contenant des images de personnes sont cryptés et accessibles uniquement au propriétaire du système.

À qui profite la reconnaissance ?

La plupart des magasins ont déjà installé des caméras de vidéosurveillance. Pour l'analyse vidéo, une mise à jour matérielle n'est pas requise : il suffit de vous connecter au service cloud. Et avec le service d’analyse vidéo Ivideon, il n’y a pratiquement aucune barrière à l’entrée. Coût de la solution à partir de 1 700 roubles par caméra, tout entrepreneur a accès au logiciel.

La principale raison qui pousse les détaillants à utiliser la technologie de reconnaissance faciale est de prévenir le vol. Selon Selon Selon la National Retail Foundation, rien qu'aux États-Unis, environ 1,33 % de tous les biens en 2017 ont été perdus à cause d'un vol, soit pas moins de 46,8 milliards de dollars de dommages.

Les technologies de reconnaissance faciale réduisent le vol à l'étalage de plus de 30 %.

Souvent, le montant des dommages est influencé par des facteurs secondaires : négligence des employés, mauvaise formation du service de sécurité, volonté d'économiser de l'argent. Ces problèmes et d’autres doivent être résolus à l’aide de caméras et de technologies cloud.

Le système de reconnaissance faciale facilite un travail rapide avec les listes « noires » : il compare la photo du client avec une base de données de visages peu fiables et, en cas de correspondance, envoie un avertissement correspondant aux agents de sécurité.

Les logiciels d'analyse améliorent considérablement la sécurité du magasin. Un voleur expérimenté est capable de remarquer les « angles morts » des caméras. Dans ce cas, le gardien peut utiliser son téléphone pour prendre une photo du suspect puis vérifier si cette personne est dans la base de données.

Les marques utilisent le marketing mobile depuis longtemps : elles envoient des SMS, des notifications push et diffusent des publicités ciblées. Pour le commerce de détail traditionnel, les systèmes de reconnaissance offrent les mêmes opportunités que celles offertes aux vendeurs en ligne grâce aux cookies.

La même plateforme utilisée pour identifier les voleurs aide les détaillants à déterminer quelles vitrines sont les plus efficaces pour attirer les acheteurs. Le système de reconnaissance permet d'identifier un client VIP dès l'entrée du magasin. Grâce aux données du CRM, le vendeur peut rapidement proposer une offre rentable au client.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages
Au Centre financier international de Séoul, des caméras sur les stands d'information en temps réel définir l'âge et le sexe de la personne, et proposer de la publicité selon les paramètres identifiés

Les informations client activent un outil puissant pour augmenter les ventes et évaluer les besoins du public. Les caméras vous aideront à personnaliser l'affichage des publicités vidéo pour un visiteur spécifique en fonction de son sexe, de son âge et de son état émotionnel, et deviendront également des fournisseurs de données pour calculer l'efficacité de la publicité.

Les opportunités ci-dessus pour les détaillants ressemblent souvent à un bruit publicitaire ennuyeux. Les thèses sur la « croissance des bénéfices » et les « besoins du public » accompagnent tout outil informatique du marché – de l'ERP aux étiquettes de prix électroniques. Les systèmes de reconnaissance faciale ne se résument-ils pas à du pur marketing sur l’intelligence artificielle et les technologies futures ? Répondons à cette question à travers des exemples d'utilisation de systèmes réels dans des magasins existants.

« Travailler sur le terrain » : qui reconnaît les visages en conditions réelles

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

7-Eleven est la plus grande chaîne de vente au détail au monde, exploitant plus de 36 000 petits magasins dans 18 pays sous la direction de Seven-Eleven Japan. Récemment, la société a établi logiciels dans 11 000 de ses magasins. La technologie de reconnaissance faciale et d'analyse du comportement dans le réseau de vente au détail est utilisée pour identifier les titulaires de cartes de fidélité, surveiller le trafic client et déterminer le niveau de stock de marchandises dans les entrepôts.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Saks est une chaîne de vente au détail haut de gamme centenaire qui appartient actuellement à l'une des plus anciennes entreprises au monde (fondée en 1670), la Compagnie de la Baie d'Hudson. Analyse vidéo d'occasion chez Saks principalement pour prévenir le vol. Le logiciel vérifie les photos des voleurs à l'étalage présumés par rapport à une base de données de voleurs à l'étalage connus. Les caméras sont mises en réseau afin que les résultats puissent être visualisés au siège de Saks à New York.

Selon le Guardian, les magasins et hôtels haut de gamme en Europe utilisent régulièrement la technologie de reconnaissance faciale pour suivre les VIP et les célébrités afin de garantir qu'ils bénéficient de la meilleure expérience possible.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Aux USA, la chaîne de burger CaliBurger utilise technologie de reconnaissance faciale dans le programme de fidélité. Le kiosque interactif « reconnaît » les clients, mémorise les commandes, propose des plats préférés et accepte les paiements avec identification faciale.

Le système élimine les obstacles à l'accès au programme de récompenses pour les personnes âgées qui pourraient avoir des difficultés à utiliser les applications mobiles, les points de récompense et les cartes de crédit.

Les systèmes de reconnaissance faciale sont largement utilisés en Asie, notamment en Chine, où ils permettent de payer de la nourriture, de retirer de l'argent à un distributeur automatique ou encore de contracter des emprunts. En Chine, la précision de la reconnaissance faciale dépasse les capacités de l’œil humain. Cela est également dû à la transition à grande échelle de la Chine de la reconnaissance 2D à la reconnaissance 3D.

Dans le premier cas, les algorithmes utilisent pour analyse des images bidimensionnelles accumulées dans des bases de données. La reconnaissance 3D analyse les images XNUMXD reconstruites et démontre une précision bien supérieure. En Chine, le scanner facial peut être utilisé pour effectuer des achats (par exemple, payer des commandes chez KFC), effectuer des paiements et entrer dans des bâtiments.

L'analyse vidéo combine : ce que le cerveau et les machines font avec nos visages

Vers Alipay besoin de sourire, pour que le système de reconnaissance des paiements comprenne : devant lui se trouve non pas une photographie, mais une personne vivante. On prétend qu’il est impossible de tromper Alipay : changer de couleur de cheveux, de maquillage ou utiliser une perruque ne change rien. Le système utilise un ensemble de traits distinctifs qui prennent en compte la géométrie du visage et l'emplacement de certains points sur celui-ci.

résultats

L’ampleur des investissements directs des entreprises occidentales et chinoises dans les technologies de reconnaissance faciale est énorme. Néanmoins, en Russie, la mise en œuvre de tels projets n’est qu’une question de temps. Les grandes entreprises commerciales comprennent déjà les avantages et l’impact économique. Si l’on considère la reconnaissance faciale comme un produit, il est important de comprendre que chaque segment d’activité a ses spécificités, notamment en matière de tarification. Plus l'entreprise est grande, plus il faudra de caméras et de modules d'analyse. Les solutions destinées aux grandes entreprises sont toujours des projets personnalisés complexes, et la personnalisation nécessite des fonds supplémentaires. Les moyennes et petites entreprises peuvent facilement se débrouiller avec une seule caméra dotée d'un module de reconnaissance faciale connecté. Dans ce cas, le coût de la solution est comparable à celui de la vidéosurveillance cloud.

Source: habr.com