O MIT removeu a coleção Tiny Images após identificar termos racistas e misóginos

Instituto de Tecnologia de Massachusetts deletado conjunto de dados Imagens minúsculas, apresentando uma coleção comentada de 80 milhões de pequenas imagens 32x32. O conjunto foi mantido por um grupo que desenvolve tecnologias de visão computacional e tem sido utilizado desde 2008 por diversos pesquisadores para treinar e testar o reconhecimento de objetos em sistemas de aprendizado de máquina.

O motivo da remoção foi revelador o uso de termos racistas e misóginos nas etiquetas que descrevem os objetos retratados nas fotos, bem como a presença de imagens percebidas como ofensivas. Por exemplo, havia imagens de órgãos genitais com gírias, imagens de algumas mulheres foram caracterizadas como “prostitutas” e foram utilizados termos inaceitáveis ​​na sociedade moderna para negros e asiáticos.

No entanto, o documento citado pelo MIT também identifica problemas mais graves com tais coleções: tecnologias de visão computacional podem ser utilizadas para desenvolver sistemas de reconhecimento facial para procurar representantes de grupos populacionais proibidos por algum motivo; uma rede neural para geração de imagens pode reconstruir o original a partir de dados anonimizados.

O motivo do aparecimento de palavras inválidas foi a utilização de um processo automatizado que utiliza relações semânticas do banco de dados lexical inglês para classificar WordNet, criado na década de 1980 na Universidade de Princeton. Como não é possível verificar manualmente a presença de linguagem ofensiva em 80 milhões de pequenas imagens, optou-se por bloquear completamente o acesso ao banco de dados. O MIT também pediu a outros pesquisadores que parassem de usar a coleção e removessem cópias dela. Problemas semelhantes são observados no maior banco de dados de imagens anotadas IMAGEnet, que também usa âncoras do WordNet.

O MIT removeu a coleção Tiny Images após identificar termos racistas e misóginos

O MIT removeu a coleção Tiny Images após identificar termos racistas e misóginos

Fonte: opennet.ru

Adicionar um comentário