MIT ngahapus koleksi Gambar Tiny saatos ngaidentipikasi istilah rasis sareng misoginis

Massachusetts Institute of Téknologi dipupus susunan data Gambar Leutik, Nampilkeun koleksi annotated tina 80 juta gambar leutik 32x32. Set éta dijaga ku grup anu ngembangkeun téknologi visi komputer sareng parantos dianggo saprak 2008 ku sababaraha panaliti pikeun ngalatih sareng nguji pangakuan objék dina sistem pembelajaran mesin.

Alesan pikeun ngaleupaskeun éta idéntifikasi pamakéan istilah rasialis jeung misogynistic dina labél ngajéntrékeun objék digambarkeun dina gambar, kitu ogé ayana gambar nu dianggap karasa. Contona, aya gambar tina aurat jeung istilah slang, gambar tina sababaraha awéwé anu dicirikeun salaku "whores,"Jeung istilah nu éta unacceptable di masarakat modern pikeun blacks na Asians dipaké.

Sanajan kitu, dokumen nu dicutat ku MIT ogé ngaidentipikasi masalah leuwih serius jeung kumpulan sapertos: téhnologi visi komputer bisa dipaké pikeun ngembangkeun sistem pangakuan raray pikeun neangan wawakil grup populasi nu dilarang pikeun sababaraha alesan; jaringan saraf pikeun generasi gambar bisa ngarekonstruksikeun aslina tina data anonim.

Alesan pikeun munculna kecap-kecap anu teu sah nyaéta ngagunakeun prosés otomatis anu ngagunakeun hubungan semantik tina pangkalan data leksikal basa Inggris pikeun mengklasifikasikan. wordnet, dijieun dina 1980s di Universitas Princeton. Kusabab teu mungkin sacara manual mariksa ayana basa karasa dina 80 juta gambar leutik, éta ieu mutuskeun pikeun sakabéhna meungpeuk aksés ka database. MIT ogé ngadesek peneliti séjén pikeun ngeureunkeun ngagunakeun koleksi sareng ngahapus salinanana. Masalah anu sami dititénan dina database gambar annotated panggedéna IMAGEnet, anu ogé ngagunakeun jangkar tina WordNet.

MIT ngahapus koleksi Gambar Tiny saatos ngaidentipikasi istilah rasis sareng misoginis

MIT ngahapus koleksi Gambar Tiny saatos ngaidentipikasi istilah rasis sareng misoginis

sumber: opennet.ru

Tambahkeun komentar