MIT menghapus koleksi Tiny Images setelah mengidentifikasi istilah rasis dan misoginis

Institut Teknologi Massachusetts dihapus Himpunan data Gambar Kecil, menampilkan koleksi 80 juta gambar kecil berukuran 32x32 yang diberi anotasi. Kumpulan ini dikelola oleh kelompok yang mengembangkan teknologi visi komputer dan telah digunakan sejak tahun 2008 oleh berbagai peneliti untuk melatih dan menguji pengenalan objek dalam sistem pembelajaran mesin.

Alasan penghapusan adalah deteksi penggunaan istilah rasis dan misoginis pada label yang menggambarkan objek yang digambarkan dalam gambar, serta adanya gambar yang dianggap menyinggung. Misalnya, terdapat gambar alat kelamin dengan istilah slang, gambar beberapa perempuan yang dianggap sebagai β€œpelacur”, dan penggunaan istilah yang tidak dapat diterima dalam masyarakat modern bagi orang kulit hitam dan Asia.

Namun, dokumen yang dikutip oleh MIT juga mengidentifikasi masalah yang lebih serius dengan koleksi tersebut: teknologi visi komputer dapat digunakan untuk mengembangkan sistem pengenalan wajah untuk mencari perwakilan kelompok populasi yang dilarang karena alasan tertentu; jaringan saraf untuk pembuatan gambar dapat merekonstruksi gambar asli dari data yang dianonimkan.

Alasan munculnya kata-kata yang tidak valid adalah penggunaan proses otomatis yang menggunakan hubungan semantik dari database leksikal bahasa Inggris untuk mengklasifikasikannya WordNet, dibuat pada tahun 1980-an di Universitas Princeton. Karena tidak mungkin memeriksa secara manual keberadaan bahasa yang menyinggung di 80 juta gambar kecil, diputuskan untuk memblokir akses sepenuhnya ke database. MIT juga mendesak peneliti lain untuk berhenti menggunakan koleksi tersebut dan menghapus salinannya. Masalah serupa juga terjadi pada database gambar beranotasi terbesar IMAGEnet, yang juga menggunakan jangkar dari WordNet.

MIT menghapus koleksi Tiny Images setelah mengidentifikasi istilah rasis dan misoginis

MIT menghapus koleksi Tiny Images setelah mengidentifikasi istilah rasis dan misoginis

Sumber: opennet.ru

Tambah komentar