MIT האָט אַוועקגענומען די זאַמלונג פון קליינטשיק בילדער נאָך יידענאַפייד ראַסיסט און מיסאָגיניסטיק טערמינען

Массачусетский технологический институт אויסגעמעקט דאַטן שטעלן Tiny Images, включающий аннотированную коллекцию из 80 миллионов небольших изображений с разрешением 32×32. Набор поддерживался группой, развивающей технологии компьютерного зрения, и использовался c 2008 года различными исследователями для тренировки и проверки распознавания объектов в системах машинного обучения.

Поводом к удалению стало דיטעקשאַן использования расистских и женоненавистнических терминов в метках, характеризующих изображённые на картинках объекты, а также наличия образов, которые воспринимались как оскорбительные. Например, присутствовали изображения половых органов с жаргонными терминами, изображения некоторых женщин характеризовались как «шлюхи», применялись недопустимые в современном обществе термины для чернокожих и азиатов.

Однако в документе, на который ссылается MIT, названы и более серьёзные проблемы с такими коллекциями: технологии компьютерного зрения можно использовать для разработки систем распознавания лиц, для поиска представителей запрещённых почему-либо групп населения; нейросеть для генерации изображений может восстановить оригинал по анонимизированным данным.

Причиной появления недопустимых слов было использование автоматизированного процесса, использующего при классификации семантические связи из лексической базы данных английского языка וואָרדנעט, созданной в 1980-е годы в Принстонском университете. Так как вручную проверить наличие оскорбительной лексики в 80 млн мелких картинок не представляется возможным, было принято решение полностью закрыть доступ к БД. MIT также призвал других исследователей прекратить использование данной коллекции и удалить её копии. Аналогичные проблемы наблюдаются и в крупнейшей аннотированной базе изображений ימאַגענעט, в которой также используются привязки из WordNet.

MIT האָט אַוועקגענומען די זאַמלונג פון קליינטשיק בילדער נאָך יידענאַפייד ראַסיסט און מיסאָגיניסטיק טערמינען

MIT האָט אַוועקגענומען די זאַמלונג פון קליינטשיק בילדער נאָך יידענאַפייד ראַסיסט און מיסאָגיניסטיק טערמינען

מקור: opennet.ru

לייגן אַ באַמערקונג