MIT fjarlægði safn Tiny Images eftir að hafa borið kennsl á kynþáttafordóma og kvenfyrirlitningu

Massachusetts Institute of Technology eytt gagnasett Litlar myndir, sem inniheldur skýrt safn 80 milljóna lítilla 32x32 mynda. Settinu var viðhaldið af hópi sem þróaði tölvusjóntækni og hefur verið notað síðan 2008 af ýmsum rannsakendum til að þjálfa og prófa hlutagreiningu í vélanámskerfum.

Ástæðan fyrir brottflutningi var uppgötvun notkun kynþáttafordóma og kvenfyrirlitningar í merkimiðum sem lýsa hlutunum sem sýndir eru á myndunum, sem og tilvist mynda sem þóttu móðgandi. Til dæmis voru myndir af kynfærum með slangurorðum, myndir af sumum konum voru einkenndar sem „hórur“ og hugtök sem voru óviðunandi í nútímasamfélagi fyrir blökkumenn og Asíubúa voru notuð.

Hins vegar er skjalið sem MIT vitnar til benda einnig á alvarlegri vandamál við slík söfn: tölvusjóntækni er hægt að nota til að þróa andlitsgreiningarkerfi til að leita að fulltrúum íbúahópa sem eru bannaðar af einhverjum ástæðum; taugakerfi til myndagerðar getur endurbyggt frumritið úr nafnlausum gögnum.

Ástæðan fyrir birtingu ógildra orða var notkun á sjálfvirku ferli sem notar merkingartengsl úr enska orðasafnsgagnagrunninum til að flokka orðnet, stofnað á níunda áratugnum við Princeton háskólann. Þar sem ekki er hægt að kanna handvirkt tilvist móðgandi orðalags í 1980 milljónum smámynda var ákveðið að loka algjörlega fyrir aðgang að gagnagrunninum. MIT hvatti einnig aðra vísindamenn til að hætta að nota safnið og fjarlægja afrit af því. Svipuð vandamál sjást í stærsta gagnagrunni með athugasemdum ImageNet, sem notar einnig akkeri frá WordNet.

MIT fjarlægði safn Tiny Images eftir að hafa borið kennsl á kynþáttafordóma og kvenfyrirlitningu

MIT fjarlægði safn Tiny Images eftir að hafa borið kennsl á kynþáttafordóma og kvenfyrirlitningu

Heimild: opennet.ru

Bæta við athugasemd