MIT выдаліў калекцыю Tiny Images з-за выяўлення расісцкіх і жанчынаненавісніцкіх тэрмінаў

Масачусецкі тэхналагічны інстытут выдаліў набор дадзеных Tiny Images, які ўключае анатаваную калекцыю з 80 мільёнаў невялікіх малюнкаў з дазволам 32×32. Набор падтрымліваўся групай, якая развівае тэхналогіі камп'ютэрнага зроку, і выкарыстоўваўся з 2008 года рознымі даследчыкамі для трэніроўкі і праверкі распазнання аб'ектаў у сістэмах машыннага навучання.

Падставай да выдалення стала выяўленне выкарыстання расісцкіх і жанчынаненавісніцкіх тэрмінаў у пазнаках, якія характарызуюць намаляваныя на карцінках аб'екты, а таксама наяўнасці вобразаў, якія ўспрымаліся як абразлівыя. Напрыклад, прысутнічалі выявы палавых органаў з жаргоннымі тэрмінамі, выявы некаторых жанчын характарызаваліся як «шлюхі», ужываліся недапушчальныя ў сучасным грамадстве тэрміны для чарнаскурых і азіятаў.

Аднак у дакуменце, на які спасылаецца MIT, названы і больш сур'ёзныя праблемы з такімі калекцыямі: тэхналогіі камп'ютарнага зроку можна выкарыстоўваць для распрацоўкі сістэм распазнання асоб, для пошуку прадстаўнікоў забароненых чамусьці груп насельніцтва; нейрасетку для генерацыі малюнкаў можа аднавіць арыгінал па ананімізаваных дадзеных.

Прычынай з'яўлення недапушчальных слоў было выкарыстанне аўтаматызаванага працэсу, які выкарыстоўвае пры класіфікацыі семантычныя сувязі з лексічнай базы даных англійскай мовы. WordNet, створанай у 1980-я гады ў Прынстанскім універсітэце. Так як уручную праверыць наяўнасць абразлівай лексікі ў 80 млн дробных карцінак не ўяўляецца магчымым, было прынята рашэнне поўнасцю закрыць доступ да БД. MIT таксама заклікаў іншых даследчыкаў спыніць выкарыстанне дадзенай калекцыі і выдаліць яе копіі. Аналагічныя праблемы назіраюцца і ў найбуйнай анатаванай базе малюнкаў IMAGEnet, у якой таксама выкарыстоўваюцца прывязкі з WordNet.

MIT выдаліў калекцыю Tiny Images з-за выяўлення расісцкіх і жанчынаненавісніцкіх тэрмінаў

MIT выдаліў калекцыю Tiny Images з-за выяўлення расісцкіх і жанчынаненавісніцкіх тэрмінаў

Крыніца: opennet.ru

Дадаць каментар