MIT đã xóa bộ sưu tập Hình ảnh nhỏ sau khi xác định các thuật ngữ phân biệt chủng tộc và sai lầm

Viện Công nghệ Massachusetts đã xóa tập dữ liệu Hình ảnh nhỏ, bao gồm bộ sưu tập có chú thích gồm 80 triệu hình ảnh nhỏ 32x32. Bộ này được duy trì bởi một nhóm phát triển công nghệ thị giác máy tính và đã được nhiều nhà nghiên cứu khác nhau sử dụng từ năm 2008 để đào tạo và kiểm tra khả năng nhận dạng đối tượng trong các hệ thống máy học.

Lý do loại bỏ là nhận biết việc sử dụng các thuật ngữ phân biệt chủng tộc và khinh thường phụ nữ trong các nhãn mô tả các đối tượng được mô tả trong ảnh, cũng như sự hiện diện của các hình ảnh được coi là xúc phạm. Ví dụ: có những hình ảnh về bộ phận sinh dục với những thuật ngữ lóng, hình ảnh một số phụ nữ được mô tả là “gái điếm” và những thuật ngữ không được chấp nhận trong xã hội hiện đại đối với người da đen và người châu Á đã được sử dụng.

Tuy nhiên, tài liệu được MIT trích dẫn còn chỉ ra những vấn đề nghiêm trọng hơn với những bộ sưu tập như vậy: công nghệ thị giác máy tính có thể được sử dụng để phát triển hệ thống nhận dạng khuôn mặt nhằm tìm kiếm đại diện của các nhóm dân cư bị cấm vì lý do nào đó; mạng lưới thần kinh để tạo hình ảnh có thể tái tạo lại bản gốc từ dữ liệu ẩn danh.

Lý do xuất hiện các từ không hợp lệ là do việc sử dụng quy trình tự động sử dụng các mối quan hệ ngữ nghĩa từ cơ sở dữ liệu từ vựng tiếng Anh để phân loại Mạng từ, được tạo ra vào những năm 1980 tại Đại học Princeton. Vì không thể kiểm tra thủ công sự hiện diện của ngôn ngữ xúc phạm trong 80 triệu bức ảnh nhỏ nên người ta đã quyết định chặn hoàn toàn quyền truy cập vào cơ sở dữ liệu. MIT cũng kêu gọi các nhà nghiên cứu khác ngừng sử dụng bộ sưu tập và xóa các bản sao của nó. Các vấn đề tương tự được quan sát thấy trong cơ sở dữ liệu hình ảnh có chú thích lớn nhất IMAGEnet, cũng sử dụng các neo từ WordNet.

MIT đã xóa bộ sưu tập Hình ảnh nhỏ sau khi xác định các thuật ngữ phân biệt chủng tộc và sai lầm

MIT đã xóa bộ sưu tập Hình ảnh nhỏ sau khi xác định các thuật ngữ phân biệt chủng tộc và sai lầm

Nguồn: opennet.ru

Thêm một lời nhận xét