MIT eemaldas Tiny Images kollektsiooni pärast rassistlike ja misogüünsete terminite tuvastamist

Massachusettsi Tehnoloogiainstituut kustutatud andmekogum Pisikesed pildid, mis sisaldab 80 miljonist väikesest 32x32 pildist koosnevat kommenteeritud kogu. Komplekti haldas arvutinägemise tehnoloogiaid arendav rühm ja seda on alates 2008. aastast kasutatud erinevate teadlaste poolt masinaõppesüsteemides objektituvastuse koolitamiseks ja testimiseks.

Eemaldamise põhjus oli märkamine rassistlike ja misogüünsete terminite kasutamine piltidel kujutatud esemeid kirjeldavatel siltidel, samuti solvavatena tajutud piltide olemasolu. Näiteks oli genitaalide kujutisi slängi terminitega, mõne naise kujutisi iseloomustati kui "hoort" ning kasutati termineid, mis olid tänapäeva ühiskonnas mustanahaliste ja asiaatide jaoks vastuvõetamatud.

MIT-i viidatud dokumendis tuuakse aga välja ka tõsisemad probleemid selliste kogudega: arvutinägemistehnoloogiate abil saab arendada näotuvastussüsteeme, et otsida mingil põhjusel keelatud elanikkonnarühmade esindajaid; kujutise genereerimiseks mõeldud närvivõrk suudab taastada originaali anonüümsete andmete põhjal.

Kehtetute sõnade ilmumise põhjuseks oli automatiseeritud protsessi kasutamine, mis kasutab klassifitseerimiseks semantilisi seoseid inglise keele leksikaalsest andmebaasist. WordNet, mis loodi 1980. aastatel Princetoni ülikoolis. Kuna 80 miljonil väikesel pildil pole võimalik solvava keele olemasolu käsitsi kontrollida, otsustati juurdepääs andmebaasile täielikult blokeerida. MIT kutsus ka teisi teadlasi üles lõpetama kollektsiooni kasutamise ja eemaldama selle koopiad. Sarnaseid probleeme täheldatakse ka suurimas kommenteeritud piltide andmebaasis IMAGEnet, mis kasutab ka WordNeti ankruid.

MIT eemaldas Tiny Images kollektsiooni pärast rassistlike ja misogüünsete terminite tuvastamist

MIT eemaldas Tiny Images kollektsiooni pärast rassistlike ja misogüünsete terminite tuvastamist

Allikas: opennet.ru

Lisa kommentaar