El MIT eliminó la colección Tiny Images después de identificar términos racistas y misóginos

Instituto de Tecnología de Massachusetts eliminado conjunto de datos Imágenes diminutas, que presenta una colección comentada de 80 millones de imágenes pequeñas de 32x32. El conjunto fue mantenido por un grupo que desarrolla tecnologías de visión por computadora y ha sido utilizado desde 2008 por varios investigadores para entrenar y probar el reconocimiento de objetos en sistemas de aprendizaje automático.

El motivo de la eliminación fue revelando el uso de términos racistas y misóginos en las etiquetas que describen los objetos representados en las imágenes, así como la presencia de imágenes que se percibían como ofensivas. Por ejemplo, había imágenes de genitales con términos de jerga, imágenes de algunas mujeres caracterizadas como "putas" y se utilizaban términos que eran inaceptables en la sociedad moderna para los negros y asiáticos.

Sin embargo, el documento citado por el MIT también identifica problemas más serios con este tipo de colecciones: las tecnologías de visión por computadora pueden usarse para desarrollar sistemas de reconocimiento facial para buscar representantes de grupos de población que están prohibidos por algún motivo; una red neuronal para la generación de imágenes puede reconstruir el original a partir de datos anonimizados.

El motivo de la aparición de palabras no válidas fue el uso de un proceso automatizado que utiliza relaciones semánticas de la base de datos léxica inglesa para clasificar WordNet, creado en la década de 1980 en la Universidad de Princeton. Como no es posible comprobar manualmente la presencia de lenguaje ofensivo en 80 millones de imágenes pequeñas, se decidió bloquear completamente el acceso a la base de datos. El MIT también instó a otros investigadores a dejar de utilizar la colección y eliminar copias de la misma. Se observan problemas similares en la base de datos de imágenes anotadas más grande. ImagenNet, que también utiliza anclajes de WordNet.

El MIT eliminó la colección Tiny Images después de identificar términos racistas y misóginos

El MIT eliminó la colección Tiny Images después de identificar términos racistas y misóginos

Fuente: opennet.ru

Añadir un comentario