Il MIT ha rimosso la raccolta Tiny Images dopo aver identificato termini razzisti e misogini

Massachusetts Institute of Technology soppresso set di dati Piccole immagini, contenente una raccolta annotata di 80 milioni di piccole immagini 32x32. Il set è stato gestito da un gruppo che sviluppa tecnologie di visione artificiale ed è stato utilizzato dal 2008 da vari ricercatori per addestrare e testare il riconoscimento degli oggetti nei sistemi di apprendimento automatico.

Il motivo della rimozione era rivelazione l'uso di termini razzisti e misogini nelle etichette che descrivono gli oggetti raffigurati nelle immagini, nonché la presenza di immagini percepite come offensive. Ad esempio, c'erano immagini di genitali con termini gergali, immagini di alcune donne erano caratterizzate come "puttane" e venivano usati termini inaccettabili nella società moderna per i neri e gli asiatici.

Tuttavia, il documento citato dal MIT identifica anche problemi più seri con tali raccolte: le tecnologie di visione artificiale possono essere utilizzate per sviluppare sistemi di riconoscimento facciale per cercare rappresentanti di gruppi di popolazione vietati per qualche motivo; una rete neurale per la generazione di immagini può ricostruire l'originale da dati anonimizzati.

Il motivo della comparsa di parole non valide è stato l'uso di un processo automatizzato che utilizza le relazioni semantiche del database lessicale inglese per classificare WordNet, creato negli anni '1980 all'Università di Princeton. Poiché non è possibile verificare manualmente la presenza di linguaggio offensivo in 80 milioni di piccole immagini, si è deciso di bloccare completamente l'accesso al database. Il MIT ha anche esortato altri ricercatori a smettere di utilizzare la raccolta e a rimuoverne le copie. Problemi simili si osservano nel più grande database di immagini annotate IMAGEnet, che utilizza anche gli ancoraggi di WordNet.

Il MIT ha rimosso la raccolta Tiny Images dopo aver identificato termini razzisti e misogini

Il MIT ha rimosso la raccolta Tiny Images dopo aver identificato termini razzisti e misogini

Fonte: opennet.ru

Aggiungi un commento