Az MIT eltávolította a Tiny Images gyűjteményt, miután rasszista és nőgyűlölő kifejezéseket azonosított

Massachusetts Institute of Technology törölve adathalmaz Apró képek80 millió kisméretű, 32x32-es képből álló, kommentárokkal ellátott gyűjteményt tartalmaz. A készletet egy számítógépes látástechnológiákat fejlesztő csoport karbantartotta, és 2008 óta használják különböző kutatók a gépi tanulási rendszerek tárgyfelismerésének betanítására és tesztelésére.

Az eltávolítás oka az volt érzékelés rasszista és nőgyűlölő kifejezések használata a képeken ábrázolt tárgyakat leíró címkékben, valamint a sértőnek vélt képek jelenléte. Voltak például nemi szervek képei szlengkifejezésekkel, egyes nők képeit „kurvákként” jellemezték, és olyan kifejezéseket használtak, amelyek a modern társadalomban elfogadhatatlanok voltak a feketék és ázsiaiak számára.

Az MIT által idézett dokumentum azonban komolyabb problémákat is azonosít az ilyen gyűjteményekkel kapcsolatban: a számítógépes látástechnológiák segítségével arcfelismerő rendszereket lehet kifejleszteni, amelyekkel meg lehet keresni a valamilyen okból tiltott lakossági csoportok képviselőit; egy képgeneráló neurális hálózat anonimizált adatokból rekonstruálhatja az eredetit.

Az érvénytelen szavak megjelenésének oka egy olyan automatizált folyamat volt, amely az angol lexikai adatbázis szemantikai kapcsolatait használja az osztályozáshoz. WordNet, amelyet az 1980-as években készítettek a Princetoni Egyetemen. Mivel 80 millió kis képen nem lehet manuálisan ellenőrizni a sértő nyelvezet jelenlétét, úgy döntöttek, hogy teljesen blokkolják az adatbázishoz való hozzáférést. Az MIT arra is felszólított más kutatókat, hogy hagyják abba a gyűjtemény használatát, és távolítsák el a másolatokat. Hasonló problémák figyelhetők meg a legnagyobb annotált képadatbázisban is ImageNet, amely szintén a WordNet horgonyait használja.

Az MIT eltávolította a Tiny Images gyűjteményt, miután rasszista és nőgyűlölő kifejezéseket azonosított

Az MIT eltávolította a Tiny Images gyűjteményt, miután rasszista és nőgyűlölő kifejezéseket azonosított

Forrás: opennet.ru

Hozzászólás