A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

A capacidade de ver e reconhecer rostos rapidamente é um superpoder. Não há necessidade de perder tempo analisando, estudando rugas, dobras e ovais. O reconhecimento facial é instantâneo e sem esforço. É tão fácil que não percebemos como o fazemos.

Pense em como os rostos diferentes são semelhantes entre si - dois olhos, uma boca, um nariz, orelhas salientes nas laterais, cada vez na mesma ordem (na maioria das vezes). É incrível analisarmos um objeto com tanta facilidade.

Estamos “programados” para reconhecer rostos desde o nascimento, mas agora as pessoas se saíram melhor - ensinaram essa habilidade à máquina. Como a introdução generalizada de sistemas de reconhecimento e identificação de pessoas afetará a vida da sociedade?

Pareidolia: pesquisa automática de rosto

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

Pessoas no modo “automático” são capazes de distinguir imagens familiares em qualquer superfície. Apenas três elementos arquitetônicos do edifício são percebidos como o rosto de um pato surpreso. Este é um exemplo de pareidolia.

A palavra pareidolia vem das palavras gregas para (para – próximo, ao redor, desvio de algo) e eidolon – imagem. Este é o nome de uma ilusão de ótica, a percepção de uma imagem ou significado onde na verdade não existe. Por exemplo, um rosto no tronco de uma árvore ou figuras de animais nas nuvens é pareidolia.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos
Mais fotos como essa podem ser encontradas em thingswithfaces.com

Vemos os rostos das pessoas e os rostos dos animais em qualquer figura geométrica. Toda a cultura emoji é construída sobre este princípio. 🙂

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

O fenômeno da pareidolia pode ser facilmente traduzido para uma linguagem algorítmica. Artistas Shinseungback Kimyonghun fotografei nuvens fundindo-se momentaneamente em rostos humanos usando um script com a biblioteca OpenCV.

A Ilusão Thatcher: Erros Biológicos Sistêmicos

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

Existe um bug biológico que mostra maior importância da habilidade de reconhecimento. A maioria dos objetos ao seu redor – uma cadeira, uma mesa, um computador – são fáceis de ver e identificar corretamente de qualquer ângulo. Só não os rostos.

Um rosto invertido cria um mau funcionamento no cérebro chamado efeito Thatcher (ilusão). O fenômeno descreve uma condição em que é difícil detectar alterações locais em um retrato invertido.

Vamos virar a foto de Margaret Thatcher e ver o resultado.A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

A primeira foto parece normal, mas se você virar, a posição incorreta dos olhos e da boca chama a atenção imediatamente. Uma pessoa e uma rede neural artificial percebem as imagens de maneira diferente. É incrível que a “rede neural” entre nossos ouvidos seja tão fácil de enganar.

A Ilusão Thatcher demonstra alguns dos mecanismos básicos pelos quais nosso cérebro processa informações. O cérebro lê uma coleção de elementos individuais: um par de olhos, um nariz, uma boca e orelhas. Além das características individuais dos traços faciais, são levadas em consideração a relação entre si e a localização. Ou seja, o rosto é percebido como um sistema integral.

Portanto, quando nos é mostrado um rosto invertido, fica mais difícil para o cérebro avaliar a imagem como um todo - as informações são “coletadas” separadamente para cada elemento: os olhos estão no lugar, a boca parece uma boca. Porém, assim que nos é mostrada a face correta, a percepção de um único sistema repentinamente se reconecta e os problemas começam: fica claro que as características usuais estão interligadas de uma forma incomum.

Por que isso é importante? O cérebro humano é capaz de reconhecer as menores diferenças nas características faciais devido à integridade da percepção. Uma área do córtex cerebral reconhece um rosto e determina a direção do olhar, a amígdala e a ínsula analisam as expressões faciais e uma área na zona pré-frontal do lobo frontal e o sistema de prazer do cérebro avalia sua beleza.

Bug como recurso: rostos de Chernov

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos
(с)

O recurso de percepção humana é usado para analisar dados multidimensionais agregados usando “rostos”. O matemático americano Herman Chernov delineou em 1973 o conceito de uso de “faces” para identificar dependências características e explorar relações complexas entre diversas variáveis.

Os dados de Chernov são refletidos na forma de pictogramas faciais, onde os valores relativos das variáveis ​​​​selecionadas são apresentados como formas e tamanhos de características individuais: comprimento do nariz, ângulo entre as sobrancelhas, largura facial - até 36 variáveis ​​​​no total. Assim, o observador pode identificar características visuais dos objetos que são únicas para cada configuração de valores.

Uma rápida olhada em um diagrama composto por faces permitirá determinar rapidamente se as características dos perfis são significativamente diferentes (coincidentes). Com uma análise detalhada das características faciais, fica claro quais características (cada característica facial é uma característica separada do conjunto de dados original) são semelhantes e quais são diferentes. Por exemplo, na ilustração acima, é fácil perceber a diferença entre os países pelos emoticons tristes e felizes.

Por que um carro precisa do seu rosto?

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

A habilidade de reconhecimento facial rápido ajuda você a pegar seu filho no jardim de infância, escolher um parceiro e expressar emoções de maneira correta e adequada. Mas o que acontece quando uma pessoa transfere essa capacidade para uma rede neural artificial?

A ideia pode ser repulsiva. Nem todo mundo está preparado para aceitar facilmente a tecnologia que armazena dados, monitora movimentos, analisa compras e emoções. A transição da simples vigilância por vídeo para a análise de vídeo personalizada implica um aumento significativo de responsabilidade.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

Hoje algoritmos como Deepface detectar semelhanças faciais com uma precisão superior à dos humanos. O algoritmo da Nvidia cria rostos de pessoas inexistentes em apenas alguns segundos. Rostos na colagem acima gerado Rede neural StyleGAN, treinada em um conjunto de dados de 70 imagens. Eles parecem assustadoramente realistas.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos
Demonstração do algoritmo SearchFace

No início, o algoritmo de reconhecimento facial do Facebook aumentou o estado de alerta, mas depois todos se acostumaram (ou abandonaram a rede social). O serviço FindFace para pesquisar pessoas por foto no VKontakte recebeu respostas mistas e foi usado para bullying, mas o encerramento de um projeto SearchFace semelhante já causou uma reação negativa dos usuários - afinal, se os dados estiverem disponíveis, deixe-os abertos para todos.

As cadeias de varejo estão instalando tecnologia de reconhecimento facial para prevenir roubos, coletar dados sobre idade, sexo e até emoções dos clientes. No final das contas, o objetivo é melhorar a experiência do cliente e ganhar dinheiro com isso. Quando os clientes perceberem que o sistema é benéfico para eles pessoalmente, muitos concordarão em implementar novas tecnologias.

Com o aumento dos casos de “roubo de identidade” – fraude de cartão de crédito e identidade –, os consumidores preferirão um sistema que esteja disponível quando necessário. identifica-os corretamente.

Atualmente, algoritmos ajudam a resolver problemas de molduras com pouca luz, baixa resolução e camuflagem, como óculos, perucas e barba por fazer de vários dias. Os sistemas operam a uma velocidade incrível e comparam um rosto a um banco de dados de milhões de pessoas em apenas um segundo.

Algumas lojas nos EUA oferta Os suspeitos de roubo têm uma escolha: permitir-se ser fotografados ou ser formalmente acusados ​​de um crime. O ladrão ganha liberdade com a proibição de visitar a loja, e sua foto é oficialmente incluída no banco de dados. Arquivos contendo imagens de pessoas são criptografados e acessíveis apenas ao proprietário do sistema.

Quem lucra com o reconhecimento?

reprodução de vídeo

A maioria das lojas já instalou câmeras CCTV. Para análise de vídeo, não é necessária atualização de hardware - basta conectar-se ao serviço em nuvem. E com o serviço de análise de vídeo da Ivideon, praticamente não há barreiras de entrada. Custo da solução a partir de 1 rublos por câmera dá a qualquer empresário acesso ao software.

O principal motivo para os varejistas usarem a tecnologia de reconhecimento facial é evitar roubos. De acordo com Conforme De acordo com a National Retail Foundation, só nos EUA, cerca de 1,33% de todos os bens em 2017 foram perdidos devido a roubo – nada menos que 46,8 mil milhões de dólares em danos.

As tecnologias de reconhecimento facial reduzem os furtos em lojas em mais de 30%.

Muitas vezes a quantidade de dano é influenciada por fatores secundários: negligência dos funcionários, má formação do serviço de segurança, desejo de economizar dinheiro. Esses e outros problemas devem ser resolvidos por meio de câmeras e tecnologias de nuvem.

O sistema de reconhecimento facial facilita o trabalho rápido com listas “negras”: compara a foto do cliente com um banco de dados de rostos não confiáveis ​​e, se houver correspondência, envia um aviso correspondente aos seguranças.

O software analítico aumenta significativamente a segurança da loja. Um ladrão experiente é capaz de perceber os “pontos cegos” das câmeras. Nesse caso, o guarda pode usar seu telefone para tirar uma foto do suspeito e depois verificar se essa pessoa consta do banco de dados.

As marcas já usam o marketing móvel há muito tempo - enviando SMS, notificações push e exibindo publicidade direcionada. Para o varejo tradicional, os sistemas de reconhecimento oferecem as mesmas oportunidades que os vendedores online receberam com os cookies.

A mesma plataforma usada para identificar ladrões está ajudando os varejistas a descobrir quais lojas são melhores para atrair compradores. O sistema de reconhecimento ajuda a identificar um cliente VIP logo na entrada da loja. Usando dados do CRM, o vendedor pode fazer rapidamente uma oferta lucrativa ao cliente.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos
No Centro Financeiro Internacional de Seul, câmeras em suportes de informação em tempo real definir idade e sexo da pessoa, e oferecer publicidade de acordo com os parâmetros identificados

As informações do cliente ativam uma ferramenta poderosa para aumentar as vendas e avaliar as necessidades do público. As câmeras ajudarão você a personalizar a exibição de anúncios em vídeo para um determinado visitante dependendo de seu sexo, idade e estado emocional, e também se tornarão fornecedoras de dados para calcular a eficácia da publicidade.

As oportunidades acima para os varejistas muitas vezes soam como um ruído publicitário irritante. Teses sobre “crescimento de lucros” e “necessidades do público” acompanham qualquer ferramenta de TI no mercado – desde ERP até etiquetas de preços eletrônicas. Os sistemas de reconhecimento facial são mais do que puro marketing sobre inteligência artificial e tecnologias futuras? Vamos responder a essa pergunta através de exemplos de utilização de sistemas reais em lojas existentes.

“Trabalho no campo”: quem reconhece rostos em condições reais

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

A 7-Eleven é a maior rede de varejo do mundo, operando mais de 36 pequenas lojas em 000 países sob a gestão da Seven-Eleven Japan. Recentemente a empresa estabeleceu software em 11 de suas lojas. A tecnologia de reconhecimento facial e análise de comportamento na rede varejista é utilizada para identificar titulares de cartões fidelidade, monitorar o tráfego de clientes e determinar o nível de estoque de mercadorias nos armazéns.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

Saks é uma rede de varejo premium centenária que atualmente pertence a uma das empresas mais antigas do mundo (fundada em 1670), a Hudson's Bay Company. Análise de vídeo usado na Saks principalmente para evitar roubos. O software verifica fotos de ladrões suspeitos em um banco de dados de ladrões conhecidos. As câmeras estão conectadas em rede para que os resultados possam ser visualizados na sede da Saks em Nova York.

De acordo com o Guardian, as lojas e hotéis premium na Europa utilizam regularmente tecnologia de reconhecimento facial para rastrear VIPs e celebridades e garantir que recebem a melhor experiência possível.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

Nos EUA, a rede de hambúrgueres CaliBurger usa tecnologia de reconhecimento facial no programa de fidelidade. O quiosque interativo “reconhece” os clientes, lembra os pedidos e oferece os pratos preferidos, além de aceitar pagamentos com identificação facial.

O sistema elimina a barreira de entrada no programa de recompensas para idosos que possam ter dificuldade em usar aplicativos móveis, pontos de recompensa e cartões de crédito.

Os sistemas de reconhecimento facial são amplamente utilizados na Ásia, especialmente na China, onde são utilizados para pagar alimentos, sacar dinheiro em caixas eletrônicos ou até mesmo contrair empréstimos. A precisão do reconhecimento facial na China excede as capacidades do olho humano. Isto também se deve à transição em grande escala da China do reconhecimento 2D para 3D.

No primeiro caso, os algoritmos utilizam imagens bidimensionais acumuladas em bancos de dados para análise. O reconhecimento 3D analisa imagens XNUMXD reconstruídas e demonstra uma precisão muito maior. Na China, o escaneamento facial pode ser usado para fazer compras (por exemplo, pagar pedidos no KFC), fazer pagamentos e entrar em edifícios.

A análise de vídeo combina: o que o cérebro e as máquinas fazem com nossos rostos

Para alipay preciso sorrir, para que o sistema de reconhecimento de pagamentos entenda: na frente dele não está uma fotografia, mas sim uma pessoa viva. Afirma-se que é impossível enganar o Alipay: mudar a cor do cabelo, a maquiagem ou usar peruca não muda nada. O sistema utiliza um conjunto de características distintivas que levam em consideração a geometria da face e a localização de determinados pontos nela.

Descobertas

A escala do investimento direto das empresas ocidentais e da China em tecnologias de reconhecimento facial é enorme. No entanto, na Rússia a implementação de tais projectos é uma questão de tempo. As grandes empresas comerciais já compreendem os benefícios e o impacto económico. Se considerarmos o reconhecimento facial como um produto, é importante entender que cada segmento de negócio tem suas especificidades, inclusive o preço. Quanto maior a empresa, mais câmeras e módulos analíticos poderão ser necessários. Soluções para grandes empresas são sempre projetos complexos e customizados, e a customização requer recursos adicionais. As médias e pequenas empresas podem sobreviver facilmente com uma câmera com um módulo de reconhecimento facial conectado. Neste caso, o custo da solução é comparável ao uso de vigilância por vídeo na nuvem.

Fonte: habr.com