இனவெறி மற்றும் பெண் வெறுப்பு வார்த்தைகளை அடையாளம் கண்ட பிறகு MIT Tiny Images சேகரிப்பை நீக்கியது

மாசசூசெட்ஸ் தொழில்நுட்ப நிறுவனம் நீக்கப்பட்டது தரவு தொகுப்பு சிறிய படங்கள், 80 மில்லியன் சிறிய 32x32 படங்களின் சிறுகுறிப்புத் தொகுப்பைக் கொண்டுள்ளது. கணினி பார்வை தொழில்நுட்பங்களை உருவாக்கும் குழுவால் இந்த தொகுப்பு பராமரிக்கப்பட்டது மற்றும் இயந்திர கற்றல் அமைப்புகளில் பொருள் அங்கீகாரத்தைப் பயிற்றுவிக்கவும் சோதிக்கவும் பல்வேறு ஆராய்ச்சியாளர்களால் 2008 முதல் பயன்படுத்தப்படுகிறது.

நீக்குவதற்கான காரணம் இருந்தது கண்டறிதல் படங்களில் சித்தரிக்கப்பட்ட பொருட்களை விவரிக்கும் லேபிள்களில் இனவெறி மற்றும் பெண் வெறுப்பு வார்த்தைகளைப் பயன்படுத்துதல், அத்துடன் தாக்குதலாகக் கருதப்பட்ட படங்களின் இருப்பு. எடுத்துக்காட்டாக, ஸ்லாங் சொற்களுடன் பிறப்புறுப்புகளின் படங்கள் இருந்தன, சில பெண்களின் படங்கள் "வேசிகள்" என்று வகைப்படுத்தப்பட்டன, மேலும் கறுப்பர்கள் மற்றும் ஆசியர்களுக்கு நவீன சமுதாயத்தில் ஏற்றுக்கொள்ள முடியாத சொற்கள் பயன்படுத்தப்பட்டன.

எவ்வாறாயினும், MIT ஆல் மேற்கோள் காட்டப்பட்ட ஆவணம் அத்தகைய சேகரிப்புகளில் மிகவும் தீவிரமான சிக்கல்களை அடையாளம் காட்டுகிறது: சில காரணங்களால் தடைசெய்யப்பட்ட மக்கள் குழுக்களின் பிரதிநிதிகளைத் தேடுவதற்கு முக அங்கீகார அமைப்புகளை உருவாக்க கணினி பார்வை தொழில்நுட்பங்களைப் பயன்படுத்தலாம்; படத்தை உருவாக்குவதற்கான ஒரு நரம்பியல் வலையமைப்பு அநாமதேய தரவுகளிலிருந்து அசலை மறுகட்டமைக்க முடியும்.

தவறான சொற்களின் தோற்றத்திற்கான காரணம், ஆங்கில லெக்சிகல் தரவுத்தளத்தில் இருந்து சொற்பொருள் உறவுகளை வகைப்படுத்துவதற்குப் பயன்படுத்தும் தானியங்கு செயல்முறையைப் பயன்படுத்துவதாகும். வேர்ட்நெட்1980 களில் பிரின்ஸ்டன் பல்கலைக்கழகத்தில் உருவாக்கப்பட்டது. 80 மில்லியன் சிறிய படங்களில் புண்படுத்தும் மொழி இருப்பதை கைமுறையாக சரிபார்க்க இயலாது என்பதால், தரவுத்தளத்திற்கான அணுகலை முற்றிலும் தடுக்க முடிவு செய்யப்பட்டது. MIT மற்ற ஆராய்ச்சியாளர்களையும் சேகரிப்பைப் பயன்படுத்துவதை நிறுத்தவும் அதன் நகல்களை அகற்றவும் வலியுறுத்தியது. பெரிய சிறுகுறிப்பு பட தரவுத்தளத்தில் இதே போன்ற சிக்கல்கள் காணப்படுகின்றன இமேஜ்நெட், இது WordNet இலிருந்து அறிவிப்பாளர்களையும் பயன்படுத்துகிறது.

இனவெறி மற்றும் பெண் வெறுப்பு வார்த்தைகளை அடையாளம் கண்ட பிறகு MIT Tiny Images சேகரிப்பை நீக்கியது

இனவெறி மற்றும் பெண் வெறுப்பு வார்த்தைகளை அடையாளம் கண்ட பிறகு MIT Tiny Images சேகரிப்பை நீக்கியது

ஆதாரம்: opennet.ru

கருத்தைச் சேர்