Das MIT hat die Tiny-Images-Sammlung entfernt, nachdem es rassistische und frauenfeindliche Begriffe identifiziert hatte

Massachusetts Institute of Technology gelöscht Datensatz Winzige Bilder, mit einer kommentierten Sammlung von 80 Millionen kleinen 32x32-Bildern. Das Set wurde von einer Gruppe gepflegt, die Computer-Vision-Technologien entwickelt, und wird seit 2008 von verschiedenen Forschern verwendet, um die Objekterkennung in maschinellen Lernsystemen zu trainieren und zu testen.

Der Grund für die Entfernung war Erkennung die Verwendung rassistischer und frauenfeindlicher Begriffe in Etiketten, die die auf den Bildern abgebildeten Objekte beschreiben, sowie das Vorhandensein von Bildern, die als anstößig empfunden wurden. Beispielsweise gab es Bilder von Genitalien mit umgangssprachlichen Begriffen, Bilder einiger Frauen wurden als „Huren“ bezeichnet und es wurden Begriffe verwendet, die in der modernen Gesellschaft für Schwarze und Asiaten inakzeptabel waren.

Das vom MIT zitierte Dokument identifiziert jedoch auch schwerwiegendere Probleme bei solchen Sammlungen: Mithilfe von Computer-Vision-Technologien können Gesichtserkennungssysteme entwickelt werden, um nach Vertretern von Bevölkerungsgruppen zu suchen, die aus irgendeinem Grund verboten sind. Ein neuronales Netzwerk zur Bilderzeugung kann aus anonymisierten Daten das Original rekonstruieren.

Der Grund für das Auftreten ungültiger Wörter war die Verwendung eines automatisierten Prozesses, der zur Klassifizierung semantische Beziehungen aus der englischen Lexikondatenbank nutzt WordNet, erstellt in den 1980er Jahren an der Princeton University. Da es nicht möglich ist, 80 Millionen kleine Bilder manuell auf anstößige Sprache zu überprüfen, wurde beschlossen, den Zugriff auf die Datenbank vollständig zu sperren. Das MIT forderte außerdem andere Forscher auf, die Sammlung nicht mehr zu nutzen und Kopien davon zu entfernen. Ähnliche Probleme werden in der größten kommentierten Bilddatenbank beobachtet IMAGEnet, das auch Anker von WordNet verwendet.

Das MIT hat die Tiny-Images-Sammlung entfernt, nachdem es rassistische und frauenfeindliche Begriffe identifiziert hatte

Das MIT hat die Tiny-Images-Sammlung entfernt, nachdem es rassistische und frauenfeindliche Begriffe identifiziert hatte

Source: opennet.ru

Kommentar hinzufügen