🥇Videoanalyse kombinerer: hvad hjernen og maskiner gør med vores ansigter

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Evnen til at se og hurtigt genkende ansigter er en supermagt. Der er ingen grund til at spilde tid på analyser, undersøgelse af rynker, folder og ovaler. Ansigtsgenkendelse er øjeblikkelig og ubesværet. Det er så nemt, at vi ikke engang er klar over, hvordan vi gør det.

Tænk på, hvordan forskellige ansigter ligner hinanden - to øjne, en mund, en næse, ører, der stikker ud på siderne, hver gang i samme rækkefølge (oftest). Det er utroligt, at vi så let kan analysere et objekt.

Vi er "programmeret" til at genkende ansigter fra fødslen, men nu har folk opnået mere - de har lært en maskine denne færdighed. Hvordan vil den udbredte indførelse af personlige anerkendelses- og identifikationssystemer påvirke samfundslivet?

Pareidolia: Automatisk ansigtssøgning

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Folk i "automatisk" tilstand er i stand til at skelne kendte billeder på enhver overflade. Kun tre arkitektoniske elementer i bygningen opfattes som ansigtet på en overrasket and. Dette er et eksempel på pareidolia.

Ordet pareidolia kommer fra de græske ord para (para – nær, omkring, afvigelse fra noget) og eidolon – billede. Dette er navnet på en optisk illusion, opfattelsen af et billede eller betydning, hvor der ikke er nogen. For eksempel er et ansigt på en træstamme eller dyrefigurer i skyerne pareidolia.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter
Flere billeder som dette kan findes på thingswithfaces.com

Vi ser ansigter på mennesker og mundkurve af dyr i enhver geometrisk figur. Hele emoji-kulturen er bygget på dette princip. 🙂

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Fænomenet pareidolia kan nemt oversættes til algoritmernes sprog. Kunstnere Shinseungback Kimyonghun fotograferede skyer, der et øjeblik smeltede sammen i menneskelige ansigter ved hjælp af et script med OpenCV-biblioteket.

Thatcher-vrangforestillingen: Systemiske biologiske fejl

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Der er en biologisk fejl, der viser den store betydning af genkendelsesevnen. De fleste af genstandene omkring dig - en stol, et bord, en computer - er nemme at se og korrekt identificeret fra enhver vinkel. Bare ikke ansigterne.

Ansigtet på hovedet skaber en fejl i hjernen kaldet Thatcher-effekten (illusion). Fænomenet beskriver en tilstand, hvor det er svært at opdage lokale ændringer i et omvendt portrætfotografi.

Lad os vende billedet af Margaret Thatcher og se på resultatet. Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Det første billede virker normalt, men hvis du vender det om, er den forkerte position af øjne og mund umiddelbart mærkbar. Mennesker og kunstige neurale netværk opfatter billeder forskelligt. Det er utroligt, at det "neurale netværk" mellem vores ører er så let at bedrage.

Thatcher-illusionen demonstrerer nogle af de grundlæggende mekanismer, hvormed vores hjerne behandler information. Hjernen læser et sæt individuelle elementer: et par øjne, en næse, en mund, ører. Ud over de individuelle karakteristika ved ansigtstræk tages der hensyn til deres forhold til hinanden og placering. Det vil sige, at ansigtet opfattes som et helt system.

Derfor, når vi får vist et omvendt ansigt, er det sværere for hjernen at vurdere billedet som helhed - information "samles" separat for hvert element: øjnene er på plads, munden ligner en mund. Men så snart vi får vist det rigtige ansigt, genoprettes opfattelsen af et enkelt system, og problemer begynder: Det bliver klart, at velkendte funktioner er forbundet med hinanden på en usædvanlig måde.

Hvorfor er dette vigtigt? Den menneskelige hjerne er i stand til at genkende de mindste forskelle i ansigtstræk takket være opfattelsens holistiske natur. En region af hjernebarken genkender ansigtet og bestemmer blikkets retning, amygdala og insula analyserer ansigtsudtryk, og en region i frontallappens præfrontale zone og hjernens nydelsessystem vurderer dens skønhed.

Bug som indslag: Chernovs ansigter

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter
(с)

Det særlige ved menneskelig perception bruges til at analysere aggregerede multidimensionelle data ved hjælp af "ansigter". I 1973 introducerede den amerikanske matematiker Herman Chernov konceptet med at bruge "ansigter" til at identificere mønstre og udforske komplekse sammenhænge mellem flere variabler.

Chernovs data afspejles i form af piktogramflader, hvor de relative værdier af de valgte variabler præsenteres som former og størrelser af individuelle funktioner: næselængde, øjenbrynsvinkel, ansigtsbredde - op til 36 variabler i alt. På denne måde kan observatøren identificere visuelle karakteristika for objekter, der er unikke for hver konfiguration af værdier.

Et hurtigt blik på ansigtsdiagrammet vil hurtigt afgøre, om profilegenskaberne adskiller sig væsentligt (match). En detaljeret gennemgang af ansigtstræk gør det klart, hvilke træk (hvert ansigtstræk er et særskilt træk i det originale datasæt) der ligner hinanden, og hvor de adskiller sig. For eksempel er det i illustrationen ovenfor let at bemærke forskellen mellem lande ved de triste og glade humørikoner.

Hvorfor har en bil brug for dit ansigt?

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Evnen til hurtig ansigtsgenkendelse hjælper dig med at hente dit barn fra børnehaven, vælge en partner og udtrykke følelser korrekt og passende. Men hvad sker der, når en person overfører denne evne til et kunstigt neuralt netværk?

Tanken kan være frastødende. Ikke alle er klar til nemt at acceptere teknologi, der gemmer data, overvåger bevægelser, analyserer køb og følelser. Overgangen fra simpel videoovervågning til personlig videoanalyse medfører et betydeligt øget ansvar.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

I dag er algoritmer som f.eks deepface bestemme ansigtsligheder med større nøjagtighed end mennesker. Nvidias algoritme skaber ansigter af ikke-eksisterende mennesker på få sekunder. Ansigter i collagen ovenfor genereret StyleGAN neurale netværk, trænet på et datasæt med 70 billeder. De ser skræmmende realistiske ud.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter
Demonstration af SearchFace-algoritmen

Først vakte Facebooks ansigtsgenkendelsesalgoritme øget bekymring, men så vænnede alle sig til det (eller forlod det sociale netværk). FindFace-tjenesten til at søge personer efter foto på VKontakte fik blandede anmeldelser og blev brugt til mobning, men lukningen af et lignende projekt, SearchFace, har allerede forårsaget en negativ reaktion blandt brugerne – hvis dataene er tilgængelige, så lad dem være åben for alle.

Detailkæder installerer ansigtsgenkendelsesteknologi for at forhindre tyveri, og indsamler data om kundernes alder, køn og endda følelser. I sidste ende er målet at forbedre kundeservicen og tjene penge på at gøre det. Når kunderne indser, at systemet er til gavn for dem personligt, vil mange acceptere implementeringen af nye teknologier.

Med den voksende forekomst af "identitetstyveri" - svindel med kreditkort og personoplysninger - vil forbrugerne foretrække et system, der er der, når de har brug for det. identificerer dem korrekt.

Algoritmer hjælper nu med at overvinde problemerne med dårlig belysning, lav opløsning og camouflage såsom briller, parykker og dage med skægstubbe. Systemerne fungerer med utrolige hastigheder og matcher et ansigt med en database med millioner af mennesker på blot et sekund.

Nogle butikker i USA tilbud Tyverimistænkte får et valg: Tillad, at deres billede bliver taget eller bliver formelt sigtet for forbrydelsen. Tyven opnår sin frihed sammen med et forbud mod at besøge butikken, og hans billede bliver officielt lagt ind i databasen. Filer, der indeholder billeder af personer, er krypteret og kun tilgængelige for ejeren af systemet.

Hvem tjener på anerkendelse?

De fleste butikker har allerede installeret CCTV-kameraer. Der kræves ingen hardwareopdatering til videoanalyse – bare opret forbindelse til en cloud-tjeneste. Og med videoanalysetjenesten Ivideon er adgangstærsklen praktisk talt ikke-eksisterende. Løsningsomkostninger fra 1 rubler pr. kamera giver enhver iværksætter adgang til softwaren.

Hovedmotivet for detailhandlere til at bruge ansigtsgenkendelsesteknologi er at forhindre tyveri. Ifølge Ifølge Ifølge National Retail Foundation, alene i USA, gik omkring 1,33 % af alle varer tabt på grund af tyveri i 2017 – et anslået tab på 46,8 milliarder dollars.

Ansigtsgenkendelsesteknologi reducerer butikstyveri med mere end 30 %.

Ofte er mængden af skade påvirket af sekundære faktorer: uagtsomhed af ansatte, dårlig træning af sikkerhedstjenester, ønsket om at spare penge. Disse og andre problemer skal løses ved hjælp af kameraer og cloud-teknologier.

Ansigtsgenkendelsessystemet gør det nemmere at arbejde hurtigt med "sorte" lister: det sammenligner kundens foto med en database over utroværdige personer og sender en tilsvarende advarsel til sikkerhedsvagterne, hvis der er et match.

Analytisk software øger butikkens sikkerhed markant. En erfaren tyv er i stand til at bemærke kameraernes "blinde vinkler". I dette tilfælde kan sikkerhedsvagten bruge sin telefon til at tage et billede af den mistænkte og derefter tjekke, om denne person er i databasen.

Brands har brugt mobil markedsføring i lang tid – sendt SMS, push-notifikationer og vist målrettet annoncering. For traditionel detailhandel giver genkendelsessystemer de samme muligheder, som onlineforhandlere modtog med cookies.

Den samme platform, der bruges til at opdage tyve, hjælper detailhandlere med at finde ud af, hvilke skærme der er bedst til at tiltrække kunder. Genkendelsessystemet hjælper med at identificere VIP-kunder lige ved indgangen til butikken. Ved hjælp af data fra CRM kan en sælger hurtigt give et rentabelt tilbud til en kunde.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter
På Seoul International Finance Center, kameraer på informationstavler i realtid bestemme personens alder og køn, og tilbyde annoncering i henhold til de identificerede parametre

Kundeinformation aktiverer et kraftfuldt værktøj til at øge salget og vurdere publikumsbehov. Kameraer hjælper med at tilpasse visningen af videoannoncer for en bestemt besøgende afhængigt af deres køn, alder og følelsesmæssige tilstand, og de vil også blive dataleverandører til at beregne effektiviteten af annoncering.

Ovennævnte muligheder for detailhandlere lyder ofte som irriterende reklamestøj. Specialer om "profit-vækst" og "publikumsbehov" ledsager ethvert it-værktøj på markedet - fra ERP til elektroniske prisskilte. Er der mere ved ansigtsgenkendelsessystemer end ren markedsføring om kunstig intelligens og fremtidige teknologier? Lad os besvare dette spørgsmål gennem eksempler på brug af rigtige systemer i eksisterende butikker.

"Arbejd i marken": hvem genkender ansigter under virkelige forhold

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

7-Eleven er verdens største detailkæde, der forener mere end 36 små butikker i 000 lande under ledelse af Seven-Eleven Japan. For nylig virksomheden installeret software i 11 af sine butikker. Ansigtsgenkendelse og adfærdsanalyseteknologi i detailkæder bruges til at identificere loyalitetskortindehavere, overvåge kundetrafik og bestemme lagerniveauer i varehuse.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

Saks er en århundrede gammel kæde af premium-butikker, som i øjeblikket ejes af et af de ældste virksomheder i verden (grundlagt i 1670) Hudson's Bay Company. Videoanalyse brugt Hos Saks, primært for at forhindre tyveri. Softwaren tjekker fotografier af formodede butikstyve mod en database over kendte butikstyve. Kameraerne er forbundet i netværk, så resultaterne kan ses i Saks hovedkvarter i New York.

Ifølge Guardian bruger luksusbutikker og hoteller i Europa regelmæssigt ansigtsgenkendelsesteknologi til at spore VIP'er og berømtheder for at sikre, at de får den bedst mulige oplevelse.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

I USA er CaliBurger-burgerkæden bruger ansigtsgenkendelsesteknologi i loyalitetsprogrammet. Den interaktive kiosk "genkender" kunder, husker ordrer og tilbyder yndlingsretter, tager imod betalinger med ansigtsgenkendelse.

Systemet fjerner barrieren for adgang til belønningsprogrammet for seniorer, der kan have svært ved at bruge mobilapps, belønningspoint og kreditkort.

Ansigtsgenkendelsessystemer er meget brugt i Asien, især i Kina, hvor de bruges til at betale for dagligvarer, hæve kontanter i en hæveautomat eller endda optage lån. Kinas ansigtsgenkendelses nøjagtighed overgår det menneskelige øjes evner. Dette hænger også sammen med Kinas storstilede overgang fra 2D til 3D-genkendelse.

I det første tilfælde bruger algoritmer todimensionelle billeder akkumuleret i databaser til analyse. 3D-genkendelse analyserer rekonstruerede tredimensionelle billeder og demonstrerer meget højere nøjagtighed. I Kina kan ansigtsscanning bruges til at foretage indkøb (såsom at betale for ordrer hos KFC), foretage betalinger og gå ind i bygninger.

Videoanalyse kombinerer: hvad hjernen og maskinerne gør med vores ansigter

I Alipay brug for at smileså betalingsgenkendelsessystemet forstår, at det ikke er et fotografi, men en levende person. Det hævdes, at det er umuligt at snyde Alipay: at ændre hårfarve, makeup eller bruge en paryk ændrer ikke noget. Systemet bruger et sæt karakteristiske træk, der tager højde for ansigtets geometri og placeringen af visse punkter på det.

Fund

Omfanget af vestlige virksomheders og Kinas direkte investeringer i teknologier til ansigtsgenkendelse er enorm. Men i Rusland er gennemførelsen af sådanne projekter et spørgsmål om tid. Store kommercielle virksomheder forstår allerede fordelene og den økonomiske virkning. Hvis vi betragter ansigtsgenkendelse som et produkt, er det vigtigt at forstå, at hvert forretningssegment har sine egne detaljer, herunder priser. Jo større virksomheden er, jo flere kameraer og analysemoduler kan der være behov for. Løsninger til store virksomheder er altid komplekse skræddersyede projekter, og tilpasning kræver yderligere midler. Små og mellemstore virksomheder kan nemt klare sig med kun ét kamera med et ansigtsgenkendelsesmodul tilsluttet. I dette tilfælde er omkostningerne ved løsningen sammenlignelige med at bruge cloud-videoovervågning.

Kilde: www.habr.com