El MIT elimina la col·lecció Tiny Images després d'identificar termes racistes i misògins

Institut de Tecnologia de Massachusetts esborrat conjunt de dades Imatges Minúscules, amb una col·lecció anotada de 80 milions d'imatges petites de 32x32. El conjunt va ser mantingut per un grup que desenvolupa tecnologies de visió per ordinador i ha estat utilitzat des del 2008 per diversos investigadors per entrenar i provar el reconeixement d'objectes en sistemes d'aprenentatge automàtic.

El motiu de l'eliminació va ser identificació l'ús de termes racistes i misògins en les etiquetes que descriuen els objectes representats a les imatges, així com la presència d'imatges que eren percebudes com a ofensives. Per exemple, hi havia imatges de genitals amb termes d'argot, imatges d'algunes dones es van caracteritzar com a "putes" i es van utilitzar termes que eren inacceptables a la societat moderna per als negres i els asiàtics.

Tanmateix, el document citat pel MIT també identifica problemes més greus amb aquestes col·leccions: les tecnologies de visió per ordinador es poden utilitzar per desenvolupar sistemes de reconeixement facial per cercar representants de grups de població prohibits per algun motiu; una xarxa neuronal per a la generació d'imatges pot reconstruir l'original a partir de dades anònimes.

El motiu de l'aparició de paraules no vàlides va ser l'ús d'un procés automatitzat que utilitza relacions semàntiques de la base de dades lèxica anglesa per classificar WordNet, creat a la dècada de 1980 a la Universitat de Princeton. Com que no és possible comprovar manualment la presència d'un llenguatge ofensiu en 80 milions d'imatges petites, es va decidir bloquejar completament l'accés a la base de dades. El MIT també va instar a altres investigadors a deixar d'utilitzar la col·lecció i eliminar-ne còpies. S'observen problemes similars a la base de dades d'imatges anotades més gran IMAGEnet, que també utilitza ancoratges de WordNet.

El MIT elimina la col·lecció Tiny Images després d'identificar termes racistes i misògins

El MIT elimina la col·lecció Tiny Images després d'identificar termes racistes i misògins

Font: opennet.ru

Afegeix comentari