Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning

Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning

De gamle egypterne visste mye om viviseksjon og kunne skille en lever fra en nyre ved berøring. Ved å svøpe mumier fra morgen til kveld og gjøre healing (fra trephination til å fjerne svulster), vil du uunngåelig lære å forstå anatomi.

Rikdommen av anatomiske detaljer ble mer enn oppveid av forvirring i forståelsen av organenes funksjon. Prester, leger og vanlige mennesker plasserte dristig sinnet i hjertet, og tildelte hjernen rollen som å produsere neseslim.

Etter 4 tusen år er det vanskelig å tillate deg selv å le av fellahs og faraoene - datamaskinene og datainnsamlingsalgoritmene våre ser kulere ut enn papyrusruller, og hjernen vår produserer fortsatt på mystisk vis hvem vet hva.

Så i denne artikkelen skulle det snakkes om det faktum at algoritmer for følelsesgjenkjenning har nådd hastigheten til speilnevroner når de tolker samtalepartnerens signaler, da det plutselig viste seg at nervecellene ikke var som de så ut til.

Beslutningsfeil

Som barn ser et barn på ansiktene til foreldrene sine og lærer å gjenskape et smil, sinne, selvtilfredshet og andre følelser, slik at han gjennom hele livet i forskjellige situasjoner kan smile, rynke pannen, være sint - akkurat som sine kjære gjorde.

Mange forskere tror at etterligning av følelser er bygget av et system av speilnevroner. Noen forskere uttrykker imidlertid skepsis til denne teorien: vi forstår ennå ikke funksjonene til alle hjerneceller.

Modellen for hjernefunksjon står på vaklende grunn av hypoteser. Det er ingen tvil om bare én ting: "fastvaren" til den grå substansen fra fødselen inneholder funksjoner og feil, eller mer nøyaktig funksjoner som påvirker atferd.

Speilnevroner eller andre nevroner er ansvarlige for den imiterende responsen; dette systemet fungerer bare på det grunnleggende nivået for å gjenkjenne de enkleste intensjonene og handlingene. Dette er nok for et barn, men forbanna lite for en voksen.

Vi vet at følelser i stor grad avhenger av en persons ervervede opplevelse av interaksjon med sin opprinnelige kultur. Ingen vil tro at du er en psykopat, hvis du blant muntre mennesker smiler, føler smerte, fordi i voksenlivet blir følelser brukt som et middel til å tilpasse seg til eksistensforholdene.

Vi vet ikke hva den andre personen egentlig tenker. Det er lett å gjøre antagelser: han smiler, det betyr at han har det gøy. Sinnet har en medfødt evne til å bygge luftslott av konsistente bilder av hva som skjer.

Man må bare prøve å finne ut i hvilken grad de eksisterende forutsetningene samsvarer med sannheten, og hypotesens vaklende grunn vil begynne å bevege seg: et smil er tristhet, en rynke er lykke, skjelvingen på øyelokkene er nytelse.

Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning

Den tyske psykiateren Franz Karl Müller-Lyer viste i 1889 en geometrisk-optisk illusjon assosiert med en forvrengning av oppfatningen av linjer og figurer. Illusjonen er at et segment innrammet av utovervendte spisser virker kortere enn et segment innrammet av haler. Faktisk er lengden på begge segmentene den samme.

Psykiateren trakk også oppmerksomhet til det faktum at illusjonens kontemplator, selv etter å ha målt linjene og lyttet til en forklaring av den nevrologiske bakgrunnen til bildeoppfatning, fortsetter å vurdere en linje kortere enn den andre. Det er også interessant at denne illusjonen ikke ser lik ut for alle - det er mennesker som er mindre mottakelige for den.

Psykolog Daniel Kahneman påstanderat vårt langsomme analytiske sinn gjenkjenner Müller-Lyer-trikset, men den andre delen av sinnet, som er ansvarlig for den kognitive refleksen, reagerer automatisk og nesten øyeblikkelig som svar på den nye stimulansen, og gjør feilaktige vurderinger.

En kognitiv feil er ikke bare en feil. Man kan forstå og innrømme at man ikke kan stole på øynene sine når man ser på en optisk illusjon, men å kommunisere med ekte mennesker er som å reise gjennom en intrikat labyrint.

Tilbake i 1906 proklamerte sosiologen William Sumner universaliteten til naturlig utvalg og kampen for eksistens, og overførte prinsippene for dyrs eksistens til det menneskelige samfunn. Etter hans mening løfter mennesker forent i grupper sin egen gruppe ved å nekte å analysere fakta som truer fellesskapets integritet.

Psykolog Richard Nisbett artikkel "Å fortelle mer enn vi kan vite: Verbal rapporter om mentale prosesser" viser folks motvilje mot å tro på statistikk og andre allment aksepterte data som ikke stemmer overens med deres eksisterende tro.

Magien med store tall


Se denne videoen og se hvordan skuespillerens ansiktsuttrykk endres.

Sinnet "merker" raskt og gjør antagelser i møte med utilstrekkelige data, noe som fører til paradoksale effekter, tydelig synlige i eksemplet med eksperimentet utført av regissør Lev Kuleshov.

I 1929 tok han nærbilder av en skuespiller, en tallerken fylt med suppe, et barn i en kiste og en ung jente på en sofa. Deretter ble filmen med skuddet av skuespilleren kuttet i tre deler og limt separat med rammer som viser en tallerken med suppe, et barn og en jente.

Uavhengig av hverandre kommer seerne til konklusjonen at i det første fragmentet er helten sulten, i det andre er han trist over barnets død, i det tredje er han fascinert av jenta som ligger på sofaen.

I virkeligheten endres ikke skuespillerens ansiktsuttrykk i alle tilfeller.

Og hvis du så hundre bilder, ville trikset bli avslørt?

Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning

Basert på data om den statistiske påliteligheten til sannheten om nonverbal atferd hos store grupper av mennesker, psykolog Paul Ekman opprettet et omfattende verktøy for objektiv måling av ansiktsbevegelser - "ansiktsbevegelseskodesystemet".

Han er av den oppfatning at kunstige nevrale nettverk kan brukes til å automatisk analysere folks ansiktsuttrykk. Til tross for alvorlig kritikk (Ekmans sikkerhetsprogram for flyplasser bestod ikke kontrollerte forsøk), er det et snev av sunn fornuft i disse argumentene.

Når man ser på en smilende person, kan man anta at han lurer og faktisk ikke gjør noe godt. Men hvis du (eller kameraet) ser hundre mennesker smile, er sjansen stor for at de fleste av dem faktisk har det gøy – som å se en varm standup-komiker opptre.

I eksemplet med store tall er det ikke så viktig at noen mennesker kan manipulere følelser så smart at selv professor Ekman ville blitt lurt. Med ordene til risikoekspert Nassim Taleb, er antiskjørheten til et system kraftig forbedret når gjenstanden for overvåking er et kaldt, upartisk kamera.

Ja, vi vet ikke hvordan vi gjenkjenner en løgn i ansiktet - med eller uten kunstig intelligens. Men vi forstår utmerket godt hvordan vi kan bestemme lykkenivået for hundre eller flere mennesker.

Følelsesgjenkjenning for virksomheten

Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning
Den enkleste måten å bestemme følelser fra et ansiktsbilde på er basert på klassifiseringen av nøkkelpunkter, hvis koordinater kan oppnås ved hjelp av forskjellige algoritmer. Vanligvis er flere dusin punkter merket, som knytter dem til plasseringen av øyenbryn, øyne, lepper, nese, kjeve, som lar deg fange ansiktsuttrykk.

Emosjonell bakgrunnsvurdering ved hjelp av maskinalgoritmer hjelper allerede forhandlere med å integrere online i offline så mye som mulig. Teknologien lar deg evaluere effektiviteten til reklame- og markedsføringskampanjer, bestemme kvaliteten på kundeservice og service, og også identifisere unormal oppførsel til mennesker.

Ved hjelp av algoritmer kan du spore den emosjonelle tilstanden til ansatte på kontoret (et kontor med triste mennesker er et kontor med svak motivasjon, motløshet og forfall) og "lykkeindeksen" til ansatte og kunder ved inngangen og utgangen.

Alfa-Bank i flere filialer lanserte et pilotprosjekt for å analysere kundenes følelser i sanntid. Algoritmer bygger en integrert indikator på kundetilfredshet, identifiserer trender i endringer i den emosjonelle oppfatningen av å besøke en filial, og gir en helhetsvurdering av besøket.

Hos Microsoft fortalte om å teste et system for å analysere den emosjonelle tilstanden til tilskuere på en kino (en objektiv vurdering av kvaliteten på en film i sanntid), samt for å avgjøre vinneren i "Audience Award"-nominasjonen i Imagine Cup-konkurransen (den seier ble vunnet av laget hvis prestasjon publikum reagerte mest positivt på).

Alt det ovennevnte er bare begynnelsen på en helt ny æra. Ved North Carolina State University, mens de tok utdanningskurs, ble studentenes ansikter filmet av et kamera, video fra som analysert datasynssystem som gjenkjenner følelser. Basert på innhentede data, modifiserte lærerne undervisningsstrategien.

I utdanningsprosessen blir det generelt ikke gitt tilstrekkelig oppmerksomhet til vurdering av følelser. Men du kan evaluere kvaliteten på undervisningen, elevenes engasjement, identifisere negative følelser og planlegge utdanningsprosessen basert på den mottatte informasjonen.

Ansiktsgjenkjenning Ivideon: demografi og følelser

Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning

Nå har en rapport om følelser dukket opp i systemet vårt.

Et eget «Følelser»-felt har dukket opp på hendelseskort for ansiktsgjenkjenning, og på «Rapporter»-fanen i «Ansikter»-delen er en ny type rapporter tilgjengelig – etter time og dag:

Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning
Dumme hjerner, skjulte følelser, utspekulerte algoritmer: utviklingen av ansiktsgjenkjenning

Det er mulig å laste ned kildedata for alle deteksjoner og generere egne rapporter basert på dem.

Inntil nylig opererte alle følelsesgjenkjenningssystemer på nivå med eksperimentelle prosjekter som ble testet med forsiktighet. Kostnadene for slike piloter var svært høye.

Vi ønsker å gjøre analyse til en del av den kjente verdenen av tjenester og enheter, så fra i dag er "følelser" tilgjengelig for alle Ivideon-klienter. Vi innfører ikke en spesiell tariffplan, gir ikke spesielle kameraer og gjør vårt beste for å eliminere alle mulige barrierer. Tariffer forblir uendret; hvem som helst kan koble til følelsesanalyse sammen med ansiktsgjenkjenning for 1 rubler. per måned.

Tjenesten presenteres i personlig konto bruker. Og på kampanjeside vi har samlet enda flere interessante fakta om ansiktsgjenkjenningssystemet Ivideon.

Kilde: www.habr.com

Legg til en kommentar