MIT විසින් වර්ගවාදී සහ ස්ත්‍රී ද්‍රෝහී යෙදුම් හඳුනා ගැනීමෙන් පසු Tiny Images එකතුව ඉවත් කරන ලදී

මැසචුසෙට්ස් තාක්ෂණ ආයතනය මකා දමන ලදි දත්ත කට්ටලය කුඩා පින්තූර, කුඩා 80x32 පින්තූර මිලියන 32 ක විවරණය කළ එකතුවක් ඇතුළත්. මෙම කට්ටලය පරිගණක දර්ශන තාක්ෂණයන් දියුණු කරන කණ්ඩායමක් විසින් නඩත්තු කරන ලද අතර යන්ත්‍ර ඉගෙනුම් පද්ධතිවල වස්තු හඳුනාගැනීම පුහුණු කිරීමට සහ පරීක්ෂා කිරීමට විවිධ පර්යේෂකයන් විසින් 2008 සිට භාවිතා කර ඇත.

ඉවත් කිරීමට හේතුව විය හඳුනාගැනීම පින්තූරවල නිරූපිත වස්තූන් විස්තර කරන ලේබලවල ජාතිවාදී සහ ස්ත්‍රී ද්‍රෝහී යෙදුම් භාවිතා කිරීම මෙන්ම අහිතකර ලෙස සැලකෙන රූප තිබීම. නිදසුනක් වශයෙන්, ස්ලැන්ග් යෙදුම් සහිත ලිංගික අවයවවල රූප තිබුණා, සමහර කාන්තාවන්ගේ රූප "ගණිකාවන්" ලෙස සංලක්ෂිත විය, කළු ජාතිකයින් සහ ආසියානුවන් සඳහා නූතන සමාජයේ පිළිගත නොහැකි යෙදුම් භාවිතා කරන ලදී.

කෙසේ වෙතත්, MIT විසින් උපුටා දක්වන ලද ලේඛනය එවැනි එකතු කිරීම් සමඟ වඩාත් බරපතල ගැටළු ද හඳුනා ගනී: කිසියම් හේතුවක් නිසා තහනම් කර ඇති ජනගහන කණ්ඩායම්වල නියෝජිතයින් සෙවීම සඳහා මුහුණු හඳුනාගැනීමේ පද්ධති සංවර්ධනය කිරීමට පරිගණක දර්ශන තාක්ෂණයන් භාවිතා කළ හැකිය; රූප උත්පාදනය සඳහා ස්නායුක ජාලයකට නිර්නාමික දත්ත වලින් මුල් පිටපත ප්‍රතිනිර්මාණය කළ හැක.

වලංගු නොවන වචන පෙනුමට හේතුව වර්ගීකරණය කිරීම සඳහා ඉංග්‍රීසි ශබ්දකෝෂ දත්ත ගබඩාවෙන් අර්ථකථන සම්බන්ධතා භාවිතා කරන ස්වයංක්‍රීය ක්‍රියාවලියක් භාවිතා කිරීමයි. වර්ඩ්නෙට්, ප්‍රින්ස්ටන් විශ්ව විද්‍යාලයේ 1980 ගණන්වල නිර්මාණය කරන ලදී. මිලියන 80 ක කුඩා පින්තූරවල අප්රසන්න භාෂාවක් තිබේදැයි අතින් පරීක්ෂා කළ නොහැකි බැවින්, දත්ත සමුදායට ප්රවේශය සම්පූර්ණයෙන්ම අවහිර කිරීමට තීරණය විය. MIT විසින් අනෙකුත් පර්යේෂකයන්ගෙන් ඉල්ලා සිටියේ එකතුව භාවිතා කිරීම නතර කර එහි පිටපත් ඉවත් කරන ලෙසයි. විශාලතම විවරණ රූප දත්ත ගබඩාවේ සමාන ගැටළු නිරීක්ෂණය කෙරේ ImageNet, WordNet වෙතින් නැංගුරම් ද භාවිතා කරයි.

MIT විසින් වර්ගවාදී සහ ස්ත්‍රී ද්‍රෝහී යෙදුම් හඳුනා ගැනීමෙන් පසු Tiny Images එකතුව ඉවත් කරන ලදී

MIT විසින් වර්ගවාදී සහ ස්ත්‍රී ද්‍රෝහී යෙදුම් හඳුනා ගැනීමෙන් පසු Tiny Images එකතුව ඉවත් කරන ලදී

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න