O MIT eliminou a colección Tiny Images despois de identificar termos racistas e misóxinos

Instituto Tecnolóxico de Massachusetts eliminado conxunto de datos Pequenas Imaxes, cunha colección comentada de 80 millóns de imaxes pequenas de 32 x 32. O conxunto foi mantido por un grupo que desenvolve tecnoloxías de visión por computador e é utilizado dende 2008 por diversos investigadores para adestrar e probar o recoñecemento de obxectos en sistemas de aprendizaxe automática.

O motivo da eliminación foi detección o uso de termos racistas e misóxinos en etiquetas que describen os obxectos representados nas imaxes, así como a presenza de imaxes que foron percibidas como ofensivas. Por exemplo, había imaxes de xenitais con termos de xerga, as imaxes dalgunhas mulleres caracterizáronse como "putas" e usáronse termos que eran inaceptables na sociedade moderna para negros e asiáticos.

Porén, o documento citado polo MIT tamén identifica problemas máis graves con este tipo de coleccións: as tecnoloxías de visión por ordenador pódense utilizar para desenvolver sistemas de recoñecemento facial para buscar representantes de grupos de poboación que están prohibidos por algún motivo; unha rede neuronal para a xeración de imaxes pode reconstruír o orixinal a partir de datos anónimos.

O motivo da aparición de palabras non válidas foi o uso dun proceso automatizado que utiliza relacións semánticas da base de datos léxico inglesa para clasificar WordNet, creado na década de 1980 na Universidade de Princeton. Dado que non é posible comprobar manualmente a presenza de linguaxe ofensiva en 80 millóns de imaxes pequenas, decidiuse bloquear completamente o acceso á base de datos. O MIT tamén instou a outros investigadores a deixar de usar a colección e eliminar copias dela. Obsérvanse problemas semellantes na maior base de datos de imaxes anotadas IMAGEnet, que tamén usa áncoras de WordNet.

O MIT eliminou a colección Tiny Images despois de identificar termos racistas e misóxinos

O MIT eliminou a colección Tiny Images despois de identificar termos racistas e misóxinos

Fonte: opennet.ru

Engadir un comentario