செயற்கை நுண்ணறிவு சார்பு பற்றி

செயற்கை நுண்ணறிவு சார்பு பற்றி

TL; டாக்டர்:

  • இயந்திர கற்றல் தரவுகளில் வடிவங்களைத் தேடுகிறது. ஆனால் செயற்கை நுண்ணறிவு "சார்பு"-அதாவது, தவறான வடிவங்களைக் கண்டறியலாம். உதாரணமாக, ஒரு புகைப்பட அடிப்படையிலான தோல் புற்றுநோய் கண்டறிதல் அமைப்பு மருத்துவரின் அலுவலகத்தில் எடுக்கப்பட்ட படங்களுக்கு சிறப்பு கவனம் செலுத்தலாம். இயந்திர கற்றல் முடியாது புரிந்து கொள்ள: அதன் வழிமுறைகள் எண்களில் உள்ள வடிவங்களை மட்டுமே அடையாளம் காணும், மேலும் தரவு பிரதிநிதித்துவம் இல்லை என்றால், அதன் செயலாக்கத்தின் விளைவாகவும் இருக்கும். இயந்திர கற்றலின் இயக்கவியல் காரணமாக இதுபோன்ற பிழைகளைப் பிடிப்பது கடினமாக இருக்கலாம்.
  • மிகவும் வெளிப்படையான மற்றும் அச்சுறுத்தும் சிக்கல் பகுதி மனித பன்முகத்தன்மை. மக்கள் பற்றிய தரவு சேகரிப்பு நிலையில் கூட புறநிலையை இழக்க பல காரணங்கள் உள்ளன. ஆனால் இந்த பிரச்சனை மக்களை மட்டுமே பாதிக்கிறது என்று நினைக்க வேண்டாம்: ஒரு கிடங்கில் அல்லது தோல்வியுற்ற எரிவாயு விசையாழியில் வெள்ளத்தை கண்டறிய முயற்சிக்கும்போது அதே சிரமங்கள் எழுகின்றன. சில அமைப்புகள் தோலின் நிறத்தை நோக்கியதாக இருக்கலாம், மற்றவை சீமென்ஸ் சென்சார்களை நோக்கியதாக இருக்கும்.
  • இத்தகைய சிக்கல்கள் இயந்திரக் கற்றலுக்குப் புதிதல்ல, மேலும் அவை அதற்கேற்ப தனித்துவமானவை அல்ல. எந்தவொரு சிக்கலான கட்டமைப்பிலும் தவறான அனுமானங்கள் செய்யப்படுகின்றன, மேலும் ஒரு குறிப்பிட்ட முடிவு ஏன் எடுக்கப்பட்டது என்பதைப் புரிந்துகொள்வது எப்போதும் கடினம். இதை நாம் ஒரு விரிவான முறையில் எதிர்த்துப் போராட வேண்டும்: சரிபார்ப்பிற்கான கருவிகள் மற்றும் செயல்முறைகளை உருவாக்கவும் - மேலும் பயனர்கள் AI பரிந்துரைகளை கண்மூடித்தனமாகப் பின்பற்றாதபடி அவர்களுக்குக் கற்பிக்கவும். இயந்திர கற்றல் சில விஷயங்களை நம்மால் முடிந்ததை விட சிறப்பாகச் செய்கிறது - ஆனால் நாய்கள், எடுத்துக்காட்டாக, மருந்துகளைக் கண்டறிவதில் மனிதர்களை விட மிகவும் பயனுள்ளதாக இருக்கும், இது அவர்களை சாட்சிகளாகப் பயன்படுத்துவதற்கும் அவர்களின் சாட்சியத்தின் அடிப்படையில் தீர்ப்புகளை வழங்குவதற்கும் ஒரு காரணம் அல்ல. மேலும் நாய்கள், எந்த இயந்திர கற்றல் அமைப்பையும் விட மிகவும் புத்திசாலி.

இயந்திர கற்றல் இன்று மிக முக்கியமான அடிப்படை தொழில்நுட்ப போக்குகளில் ஒன்றாகும். அடுத்த தசாப்தத்தில் நம்மைச் சுற்றியுள்ள உலகத்தை தொழில்நுட்பம் மாற்றும் முக்கிய வழிகளில் இதுவும் ஒன்றாகும். இந்த மாற்றங்களின் சில அம்சங்கள் கவலைக்குரியவை. எடுத்துக்காட்டாக, தொழிலாளர் சந்தையில் இயந்திரக் கற்றலின் சாத்தியமான தாக்கம் அல்லது நெறிமுறையற்ற நோக்கங்களுக்காக அதன் பயன்பாடு (உதாரணமாக, சர்வாதிகார ஆட்சிகளால்). இந்த இடுகையில் மற்றொரு சிக்கல் உள்ளது: செயற்கை நுண்ணறிவு சார்பு.

இது எளிதான கதை அல்ல.

செயற்கை நுண்ணறிவு சார்பு பற்றி
கூகுளின் AI பூனைகளைக் கண்டுபிடிக்கும். 2012ல் வெளியான இந்தச் செய்தி அப்போது சிறப்பு வாய்ந்ததாக இருந்தது.

"AI சார்பு" என்றால் என்ன?

"மூல தரவு" ஒரு ஆக்சிமோரன் மற்றும் ஒரு மோசமான யோசனை; தரவு நன்றாகவும் கவனமாகவும் தயாரிக்கப்பட வேண்டும். -ஜெஃப்ரி போகர்

எங்கோ 2013 க்கு முன்பு, புகைப்படங்களில் பூனைகளை அங்கீகரிக்கும் ஒரு அமைப்பை உருவாக்க, நீங்கள் தர்க்கரீதியான படிகளை விவரிக்க வேண்டும். ஒரு படத்தில் மூலைகளை எவ்வாறு கண்டுபிடிப்பது, கண்களை அடையாளம் காண்பது, ரோமங்களுக்கான அமைப்புகளை பகுப்பாய்வு செய்வது, பாதங்களை எண்ணுவது மற்றும் பல. பின்னர் அனைத்து கூறுகளையும் ஒன்றாக சேர்த்து, அது உண்மையில் வேலை செய்யவில்லை என்பதைக் கண்டறியவும். ஒரு இயந்திர குதிரையைப் போலவே - கோட்பாட்டளவில் அதை உருவாக்க முடியும், ஆனால் நடைமுறையில் அதை விவரிக்க மிகவும் சிக்கலானது. இறுதி முடிவு நூற்றுக்கணக்கான (அல்லது ஆயிரக்கணக்கான) கையால் எழுதப்பட்ட விதிகள். மற்றும் ஒரு வேலை மாதிரி இல்லை.

இயந்திர கற்றலின் வருகையுடன், ஒரு குறிப்பிட்ட பொருளை அங்கீகரிப்பதற்காக "கையேடு" விதிகளைப் பயன்படுத்துவதை நிறுத்தினோம். அதற்கு பதிலாக, "இது", X, "மற்றவை", Y இன் ஆயிரம் மாதிரிகள் ஆகியவற்றை எடுத்து, அவற்றின் புள்ளிவிவர பகுப்பாய்வு அடிப்படையில் கணினியை ஒரு மாதிரியை உருவாக்க வேண்டும். நாங்கள் இந்த மாதிரிக்கு சில மாதிரித் தரவை வழங்குகிறோம், மேலும் இது ஒரு தொகுப்பிற்கு பொருந்துமா என்பதை சில துல்லியத்துடன் தீர்மானிக்கிறது. இயந்திர கற்றல் ஒரு மனிதனை எழுதுவதை விட தரவுகளிலிருந்து ஒரு மாதிரியை உருவாக்குகிறது. முடிவுகள் சுவாரஸ்யமாக உள்ளன, குறிப்பாக இமேஜ் மற்றும் பேட்டர்ன் அங்கீகாரத் துறையில், அதனால்தான் ஒட்டுமொத்த தொழில்நுட்பத் துறையும் இப்போது இயந்திர கற்றலுக்கு (எம்எல்) நகர்கிறது.

ஆனால் அது அவ்வளவு எளிதல்ல. நிஜ உலகில், X அல்லது Y இன் ஆயிரக்கணக்கான எடுத்துக்காட்டுகள் A, B, J, L, O, R மற்றும் L ஆகியவற்றைக் கொண்டிருக்கின்றன. இவை சமமாக விநியோகிக்கப்படாமல் இருக்கலாம், மேலும் சில அடிக்கடி நிகழலாம், இதனால் கணினி அதிக கட்டணம் செலுத்தும். உங்களுக்கு ஆர்வமுள்ள பொருட்களை விட அவர்களுக்கு கவனம் செலுத்துங்கள்.

இது நடைமுறையில் என்ன அர்த்தம்? எனக்கு பிடித்த உதாரணம் பட அங்கீகார அமைப்புகள் புல் நிறைந்த மலையைப் பார்த்து, "ஆடுகள்" என்று கூறுங்கள். ஏன் என்பது தெளிவாகிறது: "செம்மறியாடுகளின்" பெரும்பாலான எடுத்துக்காட்டு புகைப்படங்கள் அவர்கள் வாழும் புல்வெளிகளில் எடுக்கப்படுகின்றன, மேலும் இந்த படங்களில் புல் சிறிய வெள்ளை புழுதிகளை விட அதிக இடத்தை எடுத்துக்கொள்கிறது, மேலும் இது புல்லை அமைப்பு மிக முக்கியமானதாகக் கருதுகிறது. .

இன்னும் தீவிரமான உதாரணங்கள் உள்ளன. சமீபத்திய ஒன்று திட்டம் புகைப்படங்களில் தோல் புற்றுநோயைக் கண்டறிவதற்காக. வடிவங்களின் அளவைப் பதிவு செய்ய தோல் புற்றுநோயின் வெளிப்பாடுகளுடன் தோல் மருத்துவர்கள் பெரும்பாலும் ஆட்சியாளரை புகைப்படம் எடுப்பதாக மாறியது. ஆரோக்கியமான தோலின் எடுத்துக்காட்டு புகைப்படங்களில் ஆட்சியாளர்கள் இல்லை. AI அமைப்பைப் பொறுத்தவரை, அத்தகைய ஆட்சியாளர்கள் (இன்னும் துல்லியமாக, "ஆட்சியாளர்" என்று நாம் வரையறுக்கும் பிக்சல்கள்) எடுத்துக்காட்டுகளின் தொகுப்புகளுக்கு இடையிலான வேறுபாடுகளில் ஒன்றாக மாறியுள்ளன, மேலும் சில சமயங்களில் தோலில் ஒரு சிறிய சொறி இருப்பதை விட முக்கியமானது. எனவே தோல் புற்றுநோயை அடையாளம் காண உருவாக்கப்பட்ட அமைப்பு சில நேரங்களில் அங்கீகரிக்கப்பட்ட ஆட்சியாளர்களுக்கு பதிலாக.

இங்கே முக்கிய விஷயம் என்னவென்றால், அமைப்பு எதைப் பார்க்கிறது என்பதைப் பற்றிய சொற்பொருள் புரிதல் இல்லை. நாம் பிக்சல்களின் தொகுப்பைப் பார்க்கிறோம், அவற்றில் ஒரு செம்மறி, தோல் அல்லது ஆட்சியாளர்களைப் பார்க்கிறோம், ஆனால் கணினி ஒரு எண் கோடு மட்டுமே. அவள் முப்பரிமாண இடத்தைப் பார்க்கவில்லை, பொருள்கள், கட்டமைப்புகள் அல்லது ஆடுகளைப் பார்க்கவில்லை. அவள் தரவுகளில் உள்ள வடிவங்களைப் பார்க்கிறாள்.

இத்தகைய சிக்கல்களைக் கண்டறிவதில் உள்ள சிரமம் என்னவென்றால், நரம்பியல் நெட்வொர்க் (உங்கள் இயந்திர கற்றல் அமைப்பால் உருவாக்கப்பட்ட மாதிரி) ஆயிரக்கணக்கான நூறாயிரக்கணக்கான முனைகளைக் கொண்டுள்ளது. ஒரு மாதிரியைப் பார்த்து, அது எப்படி முடிவெடுக்கிறது என்பதைப் பார்ப்பதற்கு எளிதான வழி இல்லை. அத்தகைய வழியைக் கொண்டிருப்பது, இயந்திர கற்றலைப் பயன்படுத்தாமல், அனைத்து விதிகளையும் கைமுறையாக விவரிக்கும் அளவுக்கு செயல்முறை எளிமையானது என்று அர்த்தம். இயந்திர கற்றல் ஒரு கருப்பு பெட்டியாகிவிட்டது என்று மக்கள் கவலைப்படுகிறார்கள். (இந்த ஒப்பீடு ஏன் இன்னும் அதிகமாக உள்ளது என்பதை சிறிது நேரம் கழித்து விளக்குகிறேன்.)

இது, பொதுவாக, செயற்கை நுண்ணறிவு அல்லது இயந்திர கற்றலில் உள்ள சார்பு பிரச்சனை: தரவுகளில் வடிவங்களைக் கண்டறியும் அமைப்பு தவறான வடிவங்களைக் கண்டறியலாம், மேலும் நீங்கள் அதை கவனிக்காமல் இருக்கலாம். இது தொழில்நுட்பத்தின் அடிப்படைப் பண்பு, மேலும் கல்வித்துறையிலும் பெரிய தொழில்நுட்ப நிறுவனங்களிலும் அதனுடன் பணிபுரியும் அனைவருக்கும் இது தெளிவாகத் தெரியும். ஆனால் அதன் விளைவுகள் சிக்கலானவை, மேலும் அந்த விளைவுகளுக்கான நமது சாத்தியமான தீர்வுகளும் உள்ளன.

பின்விளைவுகளைப் பற்றி முதலில் பேசுவோம்.

செயற்கை நுண்ணறிவு சார்பு பற்றி
AI, நமக்கு மறைமுகமாக, அதிக எண்ணிக்கையிலான புரிந்துகொள்ள முடியாத சமிக்ஞைகளின் அடிப்படையில், சில வகை மக்களுக்கு ஆதரவாக ஒரு தேர்வு செய்யலாம்.

AI சார்பு காட்சிகள்

மிகத் தெளிவாகவும் பயமுறுத்தும் விதமாகவும், மனித பன்முகத்தன்மைக்கு வரும்போது இந்தப் பிரச்சனை வெளிப்படும். சமீபத்தில் ஒரு வதந்தி இருந்ததுஅமேசான் வேலை விண்ணப்பதாரர்களின் ஆரம்ப திரையிடலுக்கான இயந்திர கற்றல் அமைப்பை உருவாக்க முயற்சித்தது. அமேசான் தொழிலாளர்களில் அதிகமான ஆண்கள் இருப்பதால், "வெற்றிகரமான பணியமர்த்தல்" எடுத்துக்காட்டுகள் பெரும்பாலும் ஆண்களாகும், மேலும் கணினி பரிந்துரைத்த விண்ணப்பங்களைத் தேர்ந்தெடுப்பதில் அதிகமான ஆண்கள் இருந்தனர். அமேசான் இதைக் கவனித்தது மற்றும் கணினியை உற்பத்தியில் வெளியிடவில்லை.

இந்த எடுத்துக்காட்டில் மிக முக்கியமான விஷயம் என்னவென்றால், விண்ணப்பத்தில் பாலினம் குறிப்பிடப்படவில்லை என்ற போதிலும், இந்த அமைப்பு ஆண் விண்ணப்பதாரர்களுக்கு ஆதரவாக வதந்தி பரவியது. "நல்ல பணியமர்த்தலின்" எடுத்துக்காட்டுகளில் இந்த அமைப்பு மற்ற வடிவங்களைக் கண்டது: உதாரணமாக, பெண்கள் சாதனைகளை விவரிக்க சிறப்பு வார்த்தைகளைப் பயன்படுத்தலாம் அல்லது சிறப்பு பொழுதுபோக்குகளைக் கொண்டிருக்கலாம். நிச்சயமாக, கணினிக்கு “ஹாக்கி” என்றால் என்ன, அல்லது “மக்கள்” யார், அல்லது “வெற்றி” என்றால் என்ன என்று தெரியவில்லை - இது வெறுமனே உரையின் புள்ளிவிவர பகுப்பாய்வை மேற்கொண்டது. ஆனால் அவள் பார்த்த வடிவங்கள் பெரும்பாலும் மனிதர்களால் கவனிக்கப்படாமல் போகலாம், அவற்றில் சில (உதாரணமாக, வெவ்வேறு பாலினத்தைச் சேர்ந்தவர்கள் வெற்றியை வித்தியாசமாக விவரிக்கிறார்கள்) நாம் அவற்றைப் பார்த்தாலும் பார்ப்பது கடினமாக இருக்கும்.

மேலும் - மோசமானது. வெளிர் சருமத்தில் புற்றுநோயைக் கண்டறிவதில் மிகச் சிறந்த ஒரு இயந்திரக் கற்றல் அமைப்பு கருமையான சருமத்தில் செயல்படாமல் இருக்கலாம் அல்லது நேர்மாறாகவும் இருக்கலாம். சார்பு காரணமாக அவசியமில்லை, ஆனால் ஒருவேளை நீங்கள் வெவ்வேறு தோல் நிறத்திற்கு ஒரு தனி மாதிரியை உருவாக்க வேண்டும், வெவ்வேறு குணாதிசயங்களைத் தேர்ந்தெடுக்க வேண்டும். படத்தை அறிதல் போன்ற ஒரு குறுகிய பகுதியில் கூட இயந்திர கற்றல் அமைப்புகள் ஒன்றுக்கொன்று மாற்ற முடியாது. நீங்கள் விரும்பும் துல்லியத்தை அடையும் வரை, நீங்கள் ஆர்வமுள்ள தரவில் உள்ள அம்சங்களை நன்கு கையாள, சில நேரங்களில் சோதனை மற்றும் பிழை மூலம் கணினியை மாற்ற வேண்டும். ஆனால் நீங்கள் கவனிக்காதது என்னவென்றால், கணினி ஒரு குழுவுடன் 98% நேரம் துல்லியமாக உள்ளது, மற்றொன்றுக்கு 91% மட்டுமே (மனித பகுப்பாய்வை விட மிகவும் துல்லியமானது).

இதுவரை நான் முக்கியமாக மக்கள் மற்றும் அவர்களின் குணாதிசயங்கள் தொடர்பான உதாரணங்களைப் பயன்படுத்தினேன். இந்த சிக்கலைச் சுற்றியுள்ள விவாதம் முக்கியமாக இந்த தலைப்பில் கவனம் செலுத்துகிறது. ஆனால் மக்கள் மீதான சார்பு பிரச்சனையின் ஒரு பகுதி மட்டுமே என்பதை புரிந்து கொள்ள வேண்டியது அவசியம். நாங்கள் பல விஷயங்களுக்கு இயந்திர கற்றலைப் பயன்படுத்துவோம், மேலும் மாதிரிப் பிழை அனைத்திற்கும் பொருத்தமானதாக இருக்கும். மறுபுறம், நீங்கள் மக்களுடன் பணிபுரிந்தால், தரவுகளில் உள்ள சார்பு அவர்களுடன் தொடர்புடையதாக இருக்காது.

இதைப் புரிந்து கொள்ள, தோல் புற்றுநோய் உதாரணத்திற்குத் திரும்புவோம் மற்றும் கணினி தோல்விக்கான மூன்று அனுமான சாத்தியக்கூறுகளைக் கருத்தில் கொள்வோம்.

  1. மக்களின் பன்முகப் பரவல்: பல்வேறு தோல் நிறங்களின் சமநிலையற்ற புகைப்படங்கள், நிறமியின் காரணமாக தவறான நேர்மறைகள் அல்லது தவறான எதிர்மறைகளுக்கு வழிவகுக்கும்.
  2. சிஸ்டம் பயிற்றுவிக்கப்பட்ட தரவு, அடிக்கடி நிகழும் மற்றும் பன்முகத்தன்மையுடன் விநியோகிக்கப்படும் அம்சத்தைக் கொண்டுள்ளது, இது மக்களுடன் தொடர்புபடுத்தப்படவில்லை மற்றும் கண்டறியும் மதிப்பு இல்லை: செம்மறி புகைப்படங்களில் தோல் புற்றுநோய் அல்லது புல் புகைப்படங்களில் ஒரு ஆட்சியாளர். இந்த வழக்கில், மனிதக் கண் "ஆட்சியாளர்" என்று அடையாளம் காணும் ஏதாவது ஒரு படத்தில் கணினி பிக்சல்களைக் கண்டால், முடிவு வேறுபட்டதாக இருக்கும்.
  3. ஒருவரால் தேடினாலும் பார்க்க முடியாத மூன்றாம் தரப்புப் பண்பு தரவு கொண்டுள்ளது.

இதற்கு என்ன அர்த்தம்? தரவு வெவ்வேறு நபர்களின் குழுக்களை வித்தியாசமாகப் பிரதிநிதித்துவப்படுத்தலாம் என்பது எங்களுக்குத் தெரியும், குறைந்தபட்சம் அத்தகைய விதிவிலக்குகளைத் தேடலாம். வேறு வார்த்தைகளில் கூறுவதானால், மக்கள் குழுக்களைப் பற்றிய தரவு ஏற்கனவே சில சார்புகளைக் கொண்டுள்ளது என்று கருதுவதற்கு ஏராளமான சமூக காரணங்கள் உள்ளன. ஆட்சியரோடு போட்டோவை பார்த்தால் இந்த ஆளவே காணோம் - முன்பெல்லாம் அலட்சியப்படுத்தி விட்டோம், பரவாயில்லை என்று தெரிந்தும், சிஸ்டத்திற்கு எதுவும் தெரியாது என்பதை மறந்து விட்டோம்.

ஆனால் உங்கள் ஆரோக்கியமற்ற சருமத்தின் அனைத்து புகைப்படங்களும் ஒரு அலுவலகத்தில் ஒளிரும் ஒளியின் கீழ் எடுக்கப்பட்டிருந்தால், உங்கள் ஆரோக்கியமான சருமம் ஃப்ளோரசன்ட் ஒளியின் கீழ் எடுக்கப்பட்டால் என்ன செய்வது? ஆரோக்கியமான சருமத்தை படமாக்கி முடித்த பிறகு, ஆரோக்கியமற்ற சருமத்தை படமெடுக்கும் முன், உங்கள் மொபைலில் இயங்குதளத்தை புதுப்பித்து, ஆப்பிள் அல்லது கூகுள் இரைச்சல் குறைப்பு அல்காரிதத்தை சிறிது மாற்றினால் என்ன செய்வது? அத்தகைய அம்சங்களை எவ்வளவு தேடினாலும் ஒரு நபர் இதைக் கவனிக்க முடியாது. ஆனால் இயந்திர பயன்பாட்டு அமைப்பு இதை உடனடியாகப் பார்த்துப் பயன்படுத்தும். அவளுக்கு எதுவும் தெரியாது.

இதுவரை நாங்கள் போலியான தொடர்புகளைப் பற்றி பேசினோம், ஆனால் தரவு துல்லியமாகவும் முடிவுகள் சரியாகவும் இருக்கலாம், ஆனால் நெறிமுறை, சட்ட அல்லது மேலாண்மை காரணங்களுக்காக நீங்கள் அவற்றைப் பயன்படுத்த விரும்பவில்லை. எடுத்துக்காட்டாக, சில அதிகார வரம்புகள், பெண்கள் பாதுகாப்பான ஓட்டுநர்களாக இருந்தாலும், பெண்கள் தங்கள் காப்பீட்டில் தள்ளுபடியைப் பெற அனுமதிப்பதில்லை. வரலாற்றுத் தரவை பகுப்பாய்வு செய்யும் போது, ​​பெண் பெயர்களுக்கு குறைந்த ஆபத்து காரணியை ஒதுக்கும் ஒரு அமைப்பை நாம் எளிதாக கற்பனை செய்யலாம். சரி, தேர்வில் இருந்து பெயர்களை அகற்றுவோம். ஆனால் அமேசான் உதாரணத்தை நினைவில் கொள்ளுங்கள்: கணினி மற்ற காரணிகளின் அடிப்படையில் பாலினத்தை தீர்மானிக்க முடியும் (பாலினம் என்றால் என்ன, அல்லது கார் என்றால் என்ன என்று தெரியவில்லை என்றாலும்), மேலும் கட்டுப்பாட்டாளர் உங்கள் கட்டணங்களை முன்கூட்டியே பகுப்பாய்வு செய்யும் வரை இதை நீங்கள் கவனிக்க மாட்டீர்கள். சலுகை மற்றும் கட்டணங்கள் உங்களுக்கு அபராதம் விதிக்கப்படும்.

இறுதியாக, இதுபோன்ற அமைப்புகளை மக்கள் மற்றும் சமூக தொடர்புகளை உள்ளடக்கிய திட்டங்களுக்கு மட்டுமே பயன்படுத்துவோம் என்று கருதப்படுகிறது. இது தவறு. நீங்கள் எரிவாயு விசையாழிகளை உருவாக்கினால், உங்கள் தயாரிப்பில் பத்து அல்லது நூற்றுக்கணக்கான சென்சார்கள் மூலம் அனுப்பப்படும் டெலிமெட்ரிக்கு இயந்திரக் கற்றலைப் பயன்படுத்த விரும்புவீர்கள் (ஆடியோ, வீடியோ, வெப்பநிலை மற்றும் வேறு எந்த சென்சார்களும் ஒரு இயந்திரத்தை உருவாக்குவதற்கு மிக எளிதாகத் தழுவிக்கொள்ளக்கூடிய தரவை உருவாக்குகின்றன. கற்றல் மாதிரி). அனுமானமாக, நீங்கள் கூறலாம், “இதோ ஆயிரம் விசையாழிகளின் தரவு தோல்வியடைவதற்கு முன்பு தோல்வியடைந்தது, மேலும் ஆயிரம் விசையாழிகளின் தரவு தோல்வியுற்றது. அவற்றுக்கிடையே என்ன வித்தியாசம் என்று சொல்ல ஒரு மாதிரியை உருவாக்குங்கள். சரி, இப்போது சீமென்ஸ் சென்சார்கள் 75% மோசமான விசையாழிகளில் நிறுவப்பட்டுள்ளன, மேலும் 12% நல்லவை மட்டுமே (தோல்விகளுடன் எந்த தொடர்பும் இல்லை) என்று கற்பனை செய்து பாருங்கள். இந்த அமைப்பு சீமென்ஸ் சென்சார்கள் கொண்ட விசையாழிகளைக் கண்டறிய ஒரு மாதிரியை உருவாக்கும். அச்சச்சோ!

செயற்கை நுண்ணறிவு சார்பு பற்றி
படம் - மோரிட்ஸ் ஹார்ட், யூசி பெர்க்லி

AI சார்பை நிர்வகித்தல்

அதற்கு நாம் என்ன செய்ய முடியும்? நீங்கள் மூன்று கோணங்களில் சிக்கலை அணுகலாம்:

  1. கணினியைப் பயிற்றுவிப்பதற்கான தரவைச் சேகரித்து நிர்வகிப்பதில் முறையான கடுமை.
  2. மாதிரி நடத்தை பகுப்பாய்வு மற்றும் கண்டறிவதற்கான தொழில்நுட்ப கருவிகள்.
  3. இயந்திர கற்றலை தயாரிப்புகளில் செயல்படுத்தும்போது பயிற்சி, கல்வி மற்றும் கவனமாக இருங்கள்.

Moliere இன் புத்தகமான "The Bourgeois in the Nobility" என்ற புத்தகத்தில் ஒரு நகைச்சுவை உள்ளது: இலக்கியம் உரைநடை மற்றும் கவிதை எனப் பிரிக்கப்பட்டுள்ளது என்று ஒருவருக்குக் கூறப்பட்டது, மேலும் அவர் தனது வாழ்நாள் முழுவதும் உரைநடையில் தன்னை அறியாமலேயே பேசிக் கொண்டிருப்பதைக் கண்டு மகிழ்ச்சியடைந்தார். இன்று புள்ளிவிவர வல்லுநர்கள் இப்படித்தான் உணர்கிறார்கள்: அதை உணராமல், அவர்கள் தங்கள் வாழ்க்கையை செயற்கை நுண்ணறிவு மற்றும் மாதிரி பிழைக்காக அர்ப்பணித்துள்ளனர். மாதிரி பிழையைத் தேடுவது மற்றும் அதைப் பற்றி கவலைப்படுவது ஒரு புதிய பிரச்சனை அல்ல, அதன் தீர்வை நாம் முறையாக அணுக வேண்டும். மேலே குறிப்பிட்டுள்ளபடி, சில சந்தர்ப்பங்களில் மக்கள் தரவு தொடர்பான சிக்கல்களைப் படிப்பதன் மூலம் இதைச் செய்வது உண்மையில் எளிதானது. வெவ்வேறு மக்கள் குழுக்களைப் பற்றி எங்களுக்கு தப்பெண்ணங்கள் இருக்கலாம் என்று நாங்கள் முன்கூட்டியே கருதுகிறோம், ஆனால் சீமென்ஸ் சென்சார்கள் பற்றிய தப்பெண்ணத்தை கற்பனை செய்வது கூட கடினம்.

இவை அனைத்திலும் புதிய விஷயம் என்னவென்றால், மக்கள் இனி நேரடியாக புள்ளிவிவர பகுப்பாய்வு செய்ய மாட்டார்கள். புரிந்துகொள்ள கடினமாக இருக்கும் பெரிய, சிக்கலான மாதிரிகளை உருவாக்கும் இயந்திரங்களால் இது மேற்கொள்ளப்படுகிறது. வெளிப்படைத்தன்மை பிரச்சினை சார்பு பிரச்சனையின் முக்கிய அம்சங்களில் ஒன்றாகும். கணினி வெறும் சார்புடையது அல்ல, ஆனால் அதன் சார்புநிலையைக் கண்டறிய எந்த வழியும் இல்லை என்று நாங்கள் அஞ்சுகிறோம், மேலும் இயந்திரக் கற்றல் மற்ற வகையான ஆட்டோமேஷனிலிருந்து வேறுபட்டது, அவை சோதிக்கப்படக்கூடிய தெளிவான தர்க்கரீதியான படிகளைக் கொண்டிருக்க வேண்டும்.

இங்கு இரண்டு பிரச்சனைகள் உள்ளன. இயந்திர கற்றல் அமைப்புகளின் சில வகையான தணிக்கைகளை எங்களால் இன்னும் நடத்த முடியும். வேறு எந்த அமைப்பையும் தணிக்கை செய்வது உண்மையில் எளிதானது அல்ல.

முதலாவதாக, இயந்திர கற்றல் துறையில் நவீன ஆராய்ச்சியின் திசைகளில் ஒன்று இயந்திர கற்றல் அமைப்புகளின் முக்கியமான செயல்பாட்டை அடையாளம் காணும் முறைகளுக்கான தேடலாகும். இயந்திரக் கற்றல் (தற்போதைய நிலையில்) விஞ்ஞானத்தின் முற்றிலும் புதிய துறையாகும், அது விரைவாக மாறுகிறது, எனவே இன்று சாத்தியமற்றது விரைவில் உண்மையானதாக மாற முடியாது என்று நினைக்க வேண்டாம். திட்டம் OpenAI - இதற்கு ஒரு சுவாரஸ்யமான உதாரணம்.

இரண்டாவதாக, ஏற்கனவே உள்ள அமைப்புகள் அல்லது நிறுவனங்களின் முடிவெடுக்கும் செயல்முறையை நீங்கள் சோதித்து புரிந்து கொள்ள முடியும் என்ற எண்ணம் கோட்பாட்டில் நல்லது, ஆனால் நடைமுறையில் அப்படித்தான். ஒரு பெரிய நிறுவனத்தில் எப்படி முடிவுகள் எடுக்கப்படுகின்றன என்பதைப் புரிந்துகொள்வது எளிதானது அல்ல. முறையான முடிவெடுக்கும் செயல்முறை இருந்தாலும், மக்கள் உண்மையில் எவ்வாறு தொடர்பு கொள்கிறார்கள் என்பதைப் பிரதிபலிக்காது, மேலும் அவர்களே பெரும்பாலும் தங்கள் முடிவுகளை எடுப்பதில் தர்க்கரீதியான, முறையான அணுகுமுறையைக் கொண்டிருக்கவில்லை. என் சகா சொன்னது போல் விஜய் பாண்டே, மக்களும் கருப்பு பெட்டிகள்.

ஒன்றுடன் ஒன்று இயங்கும் பல நிறுவனங்கள் மற்றும் நிறுவனங்களில் ஆயிரம் பேரை எடுத்துக் கொள்ளுங்கள், மேலும் சிக்கல் இன்னும் சிக்கலானதாகிறது. விண்வெளி விண்கலம் திரும்பும் போது உடைக்கப்பட வேண்டும் என்பதை நாங்கள் அறிவோம், மேலும் நாசாவில் உள்ள தனிநபர்கள் ஏதேனும் மோசமாக நடக்கக்கூடும் என்று நினைப்பதற்கான காரணத்தை அளித்த தகவல்களைக் கொண்டிருந்தனர், ஆனால் அமைப்பு பொதுவாக இது எனக்குத் தெரியாது. நாசா தனது முந்தைய விண்கலத்தை இழந்த பிறகும் இதேபோன்ற தணிக்கையை மேற்கொண்டது, இன்னும் இதேபோன்ற காரணத்திற்காக அது மற்றொன்றை இழந்தது. நிறுவனங்களும் மக்களும் தெளிவான, தர்க்கரீதியான விதிகளைப் பின்பற்றுகிறார்கள் என்று வாதிடுவது எளிது-ஆனால் அனுபவம் வேறுவிதமாக நிரூபிக்கிறது. இந்த "கோஸ்ப்ளனின் மாயை".

நான் அடிக்கடி இயந்திரக் கற்றலை தரவுத்தளங்களுடன் ஒப்பிடுகிறேன், குறிப்பாக தொடர்புடையவை - கணினி அறிவியல் மற்றும் அதைச் சுற்றியுள்ள உலகின் திறன்களை மாற்றியமைத்த ஒரு புதிய அடிப்படை தொழில்நுட்பம், இது எல்லாவற்றிலும் ஒரு பகுதியாக மாறியுள்ளது, அதை நாம் உணராமல் தொடர்ந்து பயன்படுத்துகிறோம். தரவுத்தளங்களிலும் சிக்கல்கள் உள்ளன, மேலும் அவை ஒத்த இயல்புடையவை: கணினி தவறான அனுமானங்கள் அல்லது மோசமான தரவுகளின் அடிப்படையில் கட்டமைக்கப்படலாம், ஆனால் அதைக் கவனிப்பது கடினமாக இருக்கும், மேலும் கணினியைப் பயன்படுத்தும் நபர்கள் கேள்விகளைக் கேட்காமல் அவர்கள் சொல்வதைச் செய்வார்கள். ஒருமுறை உங்கள் பெயரை தவறாக உச்சரித்த வரி செலுத்துபவர்களைப் பற்றி நிறைய பழைய நகைச்சுவைகள் உள்ளன, மேலும் உங்கள் பெயரை மாற்றுவதை விட, தவறை சரிசெய்ய அவர்களை சமாதானப்படுத்துவது மிகவும் கடினம். இதைப் பற்றி சிந்திக்க பல வழிகள் உள்ளன, ஆனால் எது சிறந்தது என்பது தெளிவாகத் தெரியவில்லை: SQL இல் தொழில்நுட்ப சிக்கலா அல்லது ஆரக்கிள் வெளியீட்டில் உள்ள பிழையா அல்லது அதிகாரத்துவ நிறுவனங்களின் தோல்வியா? கணினியில் எழுத்துப்பிழை திருத்தும் அம்சம் இல்லாததற்கு வழிவகுத்த ஒரு செயல்பாட்டில் பிழையைக் கண்டறிவது எவ்வளவு கடினம்? மக்கள் புகார் செய்யத் தொடங்குவதற்கு முன்பே இதைக் கண்டுபிடித்திருக்க முடியுமா?

நேவிகேட்டரில் உள்ள காலாவதியான தரவு காரணமாக ஓட்டுநர்கள் ஆறுகளில் ஓட்டும்போது இந்த சிக்கல் கதைகளால் இன்னும் எளிமையாக விளக்கப்பட்டுள்ளது. சரி, வரைபடங்கள் தொடர்ந்து புதுப்பிக்கப்பட வேண்டும். ஆனால் உங்கள் கார் கடலில் அடித்துச் செல்லப்பட்டதற்கு டாம் டாம் எவ்வளவு குற்றம் சொல்ல வேண்டும்?

நான் இதைச் சொல்லக் காரணம் ஆம், இயந்திர கற்றல் சார்பு சிக்கல்களை உருவாக்கும். ஆனால் இந்த பிரச்சனைகள் கடந்த காலத்தில் நாம் எதிர்கொண்டதைப் போலவே இருக்கும், மேலும் அவை கடந்த காலத்தில் நம்மால் முடிந்ததைப் போலவே கவனிக்கப்பட்டு தீர்க்கப்படலாம் (அல்லது இல்லை). எனவே, ஒரு பெரிய நிறுவனத்தில் பணிபுரியும் மூத்த ஆராய்ச்சியாளர்களுக்கு AI சார்பு தீங்கு விளைவிக்கும் சூழ்நிலை ஏற்பட வாய்ப்பில்லை. பெரும்பாலும், சில முக்கியமற்ற தொழில்நுட்ப ஒப்பந்ததாரர் அல்லது மென்பொருள் விற்பனையாளர்கள், திறந்த மூல கூறுகள், நூலகங்கள் மற்றும் அவர்களுக்குப் புரியாத கருவிகளைப் பயன்படுத்தி முழங்காலில் எதையாவது எழுதுவார்கள். துரதிர்ஷ்டவசமான வாடிக்கையாளர் தயாரிப்பு விளக்கத்தில் “செயற்கை நுண்ணறிவு” என்ற சொற்றொடரை வாங்குவார், மேலும் எந்த கேள்வியும் கேட்காமல், அதை தனது குறைந்த ஊதியம் பெறும் ஊழியர்களுக்கு விநியோகித்து, AI சொல்வதைச் செய்யும்படி கட்டளையிடுவார். தரவுத்தளங்களில் இதுதான் நடந்தது. இது ஒரு செயற்கை நுண்ணறிவு பிரச்சனையோ அல்லது மென்பொருள் பிரச்சனையோ அல்ல. இது மனித காரணி.

முடிவுக்கு

இயந்திர கற்றல் ஒரு நாய்க்கு நீங்கள் கற்பிக்கக்கூடிய எதையும் செய்ய முடியும் - ஆனால் நீங்கள் நாய்க்கு சரியாக என்ன கற்றுக் கொடுத்தீர்கள் என்பதை நீங்கள் ஒருபோதும் உறுதியாக சொல்ல முடியாது.

"செயற்கை நுண்ணறிவு" என்ற சொல் இதுபோன்ற உரையாடல்களின் வழியில் மட்டுமே வருவதை நான் அடிக்கடி உணர்கிறேன். இந்தச் சொல் உண்மையில் நாம்தான் உருவாக்கினோம் என்ற தவறான எண்ணத்தை அளிக்கிறது - இந்த நுண்ணறிவு. நாங்கள் HAL9000 அல்லது Skynet க்கு செல்கிறோம் - உண்மையில் அதுதான் புரிகிறது. ஆனால் இல்லை. இவை வெறும் இயந்திரங்கள், அவற்றை சலவை இயந்திரத்துடன் ஒப்பிடுவது மிகவும் துல்லியமானது. அவள் ஒரு மனிதனை விட நன்றாக சலவை செய்கிறாள், ஆனால் நீ அவளுக்கு சலவை செய்வதற்கு பதிலாக பாத்திரங்களை வைத்தால், அவள்... அவற்றை கழுவுவாள். உணவுகள் கூட சுத்தமாகிவிடும். ஆனால் இது நீங்கள் எதிர்பார்த்தது போல் இருக்காது, மேலும் இது நடக்காது, ஏனெனில் இந்த அமைப்பு உணவுகள் தொடர்பாக எந்த தப்பெண்ணமும் உள்ளது. சலவை இயந்திரத்திற்கு உணவுகள் என்ன அல்லது உடைகள் என்னவென்று தெரியாது - இது ஆட்டோமேஷனுக்கான ஒரு எடுத்துக்காட்டு, கருத்தியல் ரீதியாக செயல்முறைகள் முன்பு எவ்வாறு தானியங்கு செய்யப்பட்டன என்பதிலிருந்து வேறுபட்டதல்ல.

நாம் கார்கள், விமானங்கள் அல்லது தரவுத்தளங்களைப் பற்றி பேசினாலும், இந்த அமைப்புகள் மிகவும் சக்திவாய்ந்ததாகவும் மிகவும் குறைவாகவும் இருக்கும். மக்கள் இந்த அமைப்புகளை எவ்வாறு பயன்படுத்துகிறார்கள், அவர்களின் நோக்கங்கள் நல்லதா அல்லது கெட்டதா, மற்றும் அவர்கள் எவ்வாறு செயல்படுகிறார்கள் என்பதைப் புரிந்துகொள்வதை அவர்கள் முழுமையாகச் சார்ந்து இருப்பார்கள்.

எனவே, "செயற்கை நுண்ணறிவு கணிதம், எனவே அது சார்புகளைக் கொண்டிருக்க முடியாது" என்று சொல்வது முற்றிலும் தவறானது. ஆனால் இயந்திரக் கற்றல் "இயல்பில் அகநிலை" என்று கூறுவதும் அதே அளவு தவறானது. இயந்திர கற்றல் தரவுகளில் வடிவங்களைக் கண்டறிகிறது, மேலும் அது என்ன மாதிரிகளைக் கண்டறிகிறது என்பது தரவைப் பொறுத்தது, மேலும் தரவு நம்மைச் சார்ந்தது. நாம் அவர்களுடன் என்ன செய்கிறோம் என்பது போல. இயந்திர கற்றல் சில விஷயங்களை நம்மால் முடிந்ததை விட சிறப்பாக செய்கிறது - ஆனால் நாய்கள், எடுத்துக்காட்டாக, போதைப்பொருட்களைக் கண்டறிவதில் மனிதர்களை விட மிகவும் பயனுள்ளதாக இருக்கும், இது அவர்களை சாட்சிகளாகப் பயன்படுத்துவதற்கும் அவர்களின் சாட்சியத்தின் அடிப்படையில் தீர்ப்புகளை வழங்குவதற்கும் ஒரு காரணம் அல்ல. மேலும் நாய்கள், எந்த இயந்திர கற்றல் அமைப்பையும் விட மிகவும் புத்திசாலி.

மொழிபெயர்ப்பு: டயானா லெட்ஸ்கயா.
திருத்துதல்: அலெக்ஸி இவனோவ்.
சமூக: @PonchikNews.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்