MIT, ırkçı ve kadın düşmanı terimleri tespit ettikten sonra Tiny Images koleksiyonunu kaldırdı

Massachusetts Teknoloji Enstitüsü silindi veri seti Minik Görüntüler80 milyon küçük 32x32 resimden oluşan açıklamalı bir koleksiyona sahiptir. Setin bakımı, bilgisayarlı görme teknolojileri geliştiren bir grup tarafından yapıldı ve 2008'den beri çeşitli araştırmacılar tarafından makine öğrenimi sistemlerinde nesne tanımayı eğitmek ve test etmek için kullanılıyor.

Kaldırılma nedeni şuydu bulma resimlerde tasvir edilen nesneleri tanımlayan etiketlerde ırkçı ve kadın düşmanı terimlerin kullanılması ve saldırgan olarak algılanan görsellerin varlığı. Örneğin argo terimler içeren cinsel organ görselleri vardı, bazı kadınların görselleri “fahişe” olarak nitelendiriliyordu ve modern toplumda siyahlar ve Asyalılar için kabul edilemeyecek terimler kullanılıyordu.

Ancak MIT tarafından alıntılanan belge, bu tür koleksiyonlarla ilgili daha ciddi sorunları da tanımlıyor: bilgisayarlı görüntü teknolojileri, herhangi bir nedenle yasaklanmış nüfus gruplarının temsilcilerini aramak için yüz tanıma sistemleri geliştirmek için kullanılabilir; görüntü oluşturmaya yönelik bir sinir ağı, orijinali anonimleştirilmiş verilerden yeniden oluşturabilir.

Geçersiz kelimelerin ortaya çıkmasının nedeni, sınıflandırmak için İngilizce sözcük veri tabanındaki anlamsal ilişkileri kullanan otomatik bir sürecin kullanılmasıydı. WordNet1980'lerde Princeton Üniversitesi'nde oluşturuldu. 80 milyon küçük resimde saldırgan dil varlığının manuel olarak kontrol edilmesi mümkün olmadığından veri tabanına erişimin tamamen engellenmesine karar verildi. MIT ayrıca diğer araştırmacıları koleksiyonu kullanmayı bırakıp kopyalarını kaldırmaya çağırdı. En büyük açıklamalı görüntü veritabanında da benzer sorunlar gözleniyor IMAGEnet, aynı zamanda WordNet'teki çapaları da kullanır.

MIT, ırkçı ve kadın düşmanı terimleri tespit ettikten sonra Tiny Images koleksiyonunu kaldırdı

MIT, ırkçı ve kadın düşmanı terimleri tespit ettikten sonra Tiny Images koleksiyonunu kaldırdı

Kaynak: opennet.ru

Yorum ekle