Azure AI இல் மைக்ரோசாப்டின் சமீபத்திய தொழில்நுட்பம் படங்களையும் மக்களையும் விவரிக்கிறது


மைக்ரோசாப்ட் ஆராய்ச்சியாளர்கள் ஒரு செயற்கை நுண்ணறிவு அமைப்பை உருவாக்கியுள்ளனர், இது பல சந்தர்ப்பங்களில் மனித விளக்கங்களை விட துல்லியமான பட தலைப்புகளை உருவாக்க முடியும். இந்த திருப்புமுனையானது, மைக்ரோசாப்ட் தனது தயாரிப்புகள் மற்றும் சேவைகளை உள்ளடக்கியதாகவும், அனைத்துப் பயனர்களுக்கும் அணுகக்கூடியதாகவும் மாற்றும் அர்ப்பணிப்பில் ஒரு முக்கிய மைல்கல்லைக் குறிக்கிறது.

"பட விளக்கம் என்பது கணினி பார்வையின் முக்கிய செயல்பாடுகளில் ஒன்றாகும், இது பரந்த அளவிலான சேவைகளை செயல்படுத்துகிறது," என்று Xuedong Huang (Xuedong Huang), வாஷிங்டனில் உள்ள ரெட்மாண்டில் உள்ள Azure AI அறிவாற்றல் சேவைகளின் மைக்ரோசாஃப்ட் தொழில்நுட்ப சக மற்றும் தலைமை தொழில்நுட்ப அதிகாரி.

இந்த புதிய மாடல் இப்போது கம்ப்யூட்டர் விஷன் மூலம் நுகர்வோருக்கு கிடைக்கிறது அசூர் அறிவாற்றல் சேவைகள், இது Azure AI இன் ஒரு பகுதியாகும், மேலும் டெவலப்பர்கள் தங்கள் சேவைகளின் கிடைக்கும் தன்மையை மேம்படுத்த இந்த திறனைப் பயன்படுத்த அனுமதிக்கிறது. இது Seeing AI செயலியிலும் சேர்க்கப்பட்டுள்ளது மற்றும் Windows மற்றும் Macக்கான Microsoft Word மற்றும் Outlook, அத்துடன் Windows, Mac மற்றும் இணையத்திற்கான PowerPoint ஆகியவற்றில் இந்த ஆண்டின் பிற்பகுதியில் தொடங்கப்படும்.

எந்தவொரு படத்தின் முக்கியமான உள்ளடக்கத்தையும் பயனர்கள் அணுகுவதற்கு தானியங்கு விளக்கம் உதவுகிறது, அது தேடல் முடிவில் கிடைத்த புகைப்படமாக இருந்தாலும் அல்லது விளக்கக்காட்சிக்கான விளக்கப்படமாக இருந்தாலும் சரி.

"இணையப் பக்கங்கள் மற்றும் ஆவணங்களில் உள்ள படங்களின் உள்ளடக்கத்தை (மாற்று அல்லது மாற்று உரை என அழைக்கப்படுகிறது) விவரிக்கும் தலைப்புகளின் பயன்பாடு பார்வையற்ற அல்லது குறைந்த பார்வை உள்ளவர்களுக்கு மிகவும் முக்கியமானது" என்று சாகிப் ஷேக் கூறினார் (சாகிப் ஷேக்), ரெட்மாண்டில் மைக்ரோசாப்டின் AI இயங்குதளக் குழுவில் மென்பொருள் மேலாளர்.

எடுத்துக்காட்டாக, பார்வையற்றோர் மற்றும் பார்வையற்றோருக்கான செயலியில் மேம்படுத்தப்பட்ட பட விளக்க அம்சத்தை அவரது குழு பயன்படுத்துகிறது AI ஐப் பார்க்கிறது, கேமரா எதை படம்பிடிக்கிறது என்பதை அடையாளம் கண்டு அதைப் பற்றி பேசுகிறது. சமூக வலைப்பின்னல்கள் உட்பட புகைப்படங்களை விவரிக்க, உருவாக்கப்பட்ட தலைப்புகளைப் பயன்பாடு பயன்படுத்துகிறது.

"வெறுமனே, ஒவ்வொருவரும் ஆவணங்கள், ஆன்லைன் மற்றும் சமூக ஊடகங்களில் உள்ள அனைத்து படங்களுக்கும் மாற்று உரையைச் சேர்க்க வேண்டும், ஏனெனில் பார்வையற்றவர்கள் உள்ளடக்கத்தை அணுகவும் உரையாடலில் பங்கேற்கவும் இது அனுமதிக்கிறது. ஆனால், ஐயோ, மக்கள் இதைச் செய்வதில்லை, ”என்கிறார் ஷேக். "இருப்பினும், எதுவும் கிடைக்காதபோது மாற்று உரையைச் சேர்க்க பட விளக்க அம்சத்தைப் பயன்படுத்தும் பல பயன்பாடுகள் உள்ளன."
  
Azure AI இல் மைக்ரோசாப்டின் சமீபத்திய தொழில்நுட்பம் படங்களையும் மக்களையும் விவரிக்கிறது

மைக்ரோசாப்டின் ரெட்மண்ட் ஆய்வகத்தின் மூத்த ஆராய்ச்சி மேலாளரான லிஜுவான் வாங், மனிதனைப் போன்ற மற்றும் சிறந்த முடிவுகளை அடைந்த ஆராய்ச்சிக் குழுவை வழிநடத்தினார். புகைப்படம்: டான் டெலாங்.

புதிய பொருட்களின் விளக்கம்

"பட விளக்கம் என்பது கணினி பார்வையின் முக்கிய பணிகளில் ஒன்றாகும், இது படத்தில் குறிப்பிடப்பட்டுள்ள முக்கிய உள்ளடக்கம் அல்லது செயலைப் புரிந்துகொண்டு விவரிக்க ஒரு செயற்கை நுண்ணறிவு அமைப்பு தேவைப்படுகிறது" என்று லிஜுவான் வாங் விளக்கினார் (லிஜுவான் வாங்), மைக்ரோசாப்டின் ரெட்மாண்ட் ஆய்வகத்தில் மூத்த ஆராய்ச்சி மேலாளர்.

"என்ன நடக்கிறது என்பதை நீங்கள் புரிந்து கொள்ள வேண்டும், பொருள்கள் மற்றும் செயல்களுக்கு இடையிலான உறவுகள் என்ன என்பதைக் கண்டுபிடிக்க வேண்டும், பின்னர் அவை அனைத்தையும் மனிதனால் புரிந்துகொள்ளக்கூடிய மொழியில் ஒரு வாக்கியத்தில் சுருக்கி விவரிக்க வேண்டும்," என்று அவர் கூறினார்.

தரப்படுத்திய ஆராய்ச்சி குழுவை வாங் வழிநடத்தினார் nocaps (நாவல் பொருள் தலைப்புகள் அளவில், புதிய பொருள்களின் பெரிய அளவிலான விளக்கம்) மனிதர்களுடன் ஒப்பிடக்கூடிய முடிவுகளை அடைந்து அவற்றை விஞ்சியது. இந்தச் சோதனையானது, AI அமைப்புகள், மாதிரி பயிற்சியளிக்கப்பட்ட தரவுத் தொகுப்பின் ஒரு பகுதியாக இல்லாத சித்தரிக்கப்பட்ட பொருட்களின் விளக்கங்களை எவ்வளவு சிறப்பாக உருவாக்குகின்றன என்பதை மதிப்பிடுகிறது.

பொதுவாக, பட விளக்க அமைப்புகள், இந்தப் படங்களின் உரை விளக்கங்களுடன் கூடிய படங்களைக் கொண்ட தரவுத்தொகுப்புகளில் பயிற்சியளிக்கப்படுகின்றன, அதாவது பெயரிடப்பட்ட படங்களின் தொகுப்புகளில்.

"பயிற்சி தரவில் காணப்படாத புதிய பொருட்களை கணினி எவ்வளவு சிறப்பாக விவரிக்க முடியும் என்பதை நோகேப்ஸ் சோதனை காட்டுகிறது" என்று வாங் கூறுகிறார்.

இந்தச் சிக்கலைத் தீர்க்க, மைக்ரோசாப்ட் குழு, ஒரு பெரிய AI மாதிரியை, வார்த்தை குறிச்சொற்கள் கொண்ட படங்களைக் கொண்ட ஒரு பரந்த தரவுத்தொகுப்பில் முன் பயிற்சி அளித்தது, அவை ஒவ்வொன்றும் படத்தில் உள்ள ஒரு குறிப்பிட்ட பொருளுடன் தொடர்புடையவை.

முழு தலைப்புகளுக்குப் பதிலாக வார்த்தைக் குறிச்சொற்களைக் கொண்ட படங்களின் தொகுப்பை உருவாக்குவது மிகவும் திறமையானது, இது வாங்கின் குழுவை தங்கள் மாதிரியில் நிறைய தரவை வழங்க அனுமதித்தது. இந்த அணுகுமுறை ஒரு காட்சி சொல்லகராதி என்று குழு அழைக்கும் மாதிரியை வழங்கியது.

ஹுவாங் விளக்கியது போல், காட்சி சொல்லகராதி முன்-கற்பித்தல் அணுகுமுறை குழந்தைகளைப் படிக்கத் தயார்படுத்துவதைப் போன்றது: முதலில், ஒரு படப் புத்தகம் பயன்படுத்தப்படுகிறது, அதில் தனிப்பட்ட சொற்கள் படங்களுடன் தொடர்புடையவை, எடுத்துக்காட்டாக, ஒரு ஆப்பிளின் புகைப்படத்தின் கீழ் அது "ஆப்பிள்" மற்றும் ஒரு பூனையின் புகைப்படத்தின் கீழ் "பூனை" என்ற வார்த்தை.

"ஒரு காட்சி அகராதியுடன் கூடிய இந்த முன் பயிற்சியானது, கணினியைப் பயிற்றுவிப்பதற்குத் தேவையான ஆரம்பக் கல்வியாகும். இப்படித்தான் ஒரு வகையான மோட்டார் நினைவகத்தை உருவாக்க முயற்சி செய்கிறோம்,” என்று ஹுவாங் கூறினார்.

முன்-பயிற்சி பெற்ற மாதிரியானது, தலைப்புப் படங்களை உள்ளடக்கிய தரவுத்தொகுப்பைப் பயன்படுத்தி சுத்திகரிக்கப்படுகிறது. பயிற்சியின் இந்த கட்டத்தில், மாதிரி வாக்கியங்களை உருவாக்க கற்றுக்கொள்கிறது. புதிய பொருள்களைக் கொண்ட ஒரு படம் தோன்றினால், துல்லியமான விளக்கங்களை உருவாக்க AI அமைப்பு ஒரு காட்சி அகராதியைப் பயன்படுத்துகிறது.

"சோதனையின் போது புதிய பொருட்களைக் கையாள்வதற்கு, முன் பயிற்சியின் போது மற்றும் அடுத்தடுத்த வளர்ச்சியின் போது கற்றுக்கொண்டதை ஒருங்கிணைக்கிறது" என்று வாங் கூறுகிறார்.
Согласно результаtam ஆராய்ச்சிநோகேப்ஸ் சோதனைகளில் மதிப்பிடப்பட்டபோது, ​​அதே படங்களுக்கு மனிதர்கள் செய்ததை விட AI அமைப்பு அதிக அர்த்தமுள்ள மற்றும் துல்லியமான விளக்கங்களை உருவாக்கியது.

பணிச்சூழலுக்கு விரைவான மாற்றம் 

மற்றவற்றுடன், புதிய பட விளக்க அமைப்பு 2015 முதல் மைக்ரோசாஃப்ட் தயாரிப்புகள் மற்றும் சேவைகளில் பயன்படுத்தப்பட்ட மாதிரியை விட இரண்டு மடங்கு சிறப்பாக உள்ளது, மற்றொரு தொழில்துறை அளவுகோலின் படி.

மைக்ரோசாஃப்ட் தயாரிப்புகள் மற்றும் சேவைகளின் அனைத்துப் பயனர்களும் இந்த மேம்பாட்டிலிருந்து பெறும் பலன்களைக் கருத்தில் கொண்டு, ஹுவாங் புதிய மாடலை Azure டெஸ்க்டாப் சூழலில் ஒருங்கிணைப்பதை துரிதப்படுத்தியுள்ளார்.

"இந்த திருப்புமுனை AI தொழில்நுட்பத்தை நாங்கள் பரந்த அளவிலான வாடிக்கையாளர்களுக்கு சேவை செய்வதற்கான ஒரு தளமாக Azure க்கு எடுத்துச் செல்கிறோம்," என்று அவர் கூறினார். "இது ஆராய்ச்சியில் மட்டுமல்ல. இந்த முன்னேற்றத்தை அஸூர் உற்பத்தி சூழலில் இணைக்க எடுத்த நேரமும் ஒரு திருப்புமுனையாகும்.

மனிதனைப் போன்ற முடிவுகளை அடைவது மைக்ரோசாப்டின் அறிவாற்றல் நுண்ணறிவு அமைப்புகளில் ஏற்கனவே நிறுவப்பட்ட ஒரு போக்கைத் தொடர்கிறது என்று ஹுவாங் கூறினார்.

"கடந்த ஐந்து ஆண்டுகளில், பேச்சு அங்கீகாரம், இயந்திர மொழிபெயர்ப்பு, கேள்வி பதில், இயந்திர வாசிப்பு மற்றும் உரை புரிதல் மற்றும் 2020 இல், கோவிட்-19 இருந்தபோதிலும், பட விளக்கம் ஆகிய ஐந்து முக்கிய பகுதிகளில் மனித அளவிலான முடிவுகளை நாங்கள் அடைந்துள்ளோம்" என்று ஜுவான் கூறினார்.

தலைப்பு மூலம்

AI ஐப் பயன்படுத்துவதற்கு முன்பும் இப்போதும் கணினி வழங்கிய பட விளக்கங்களின் முடிவுகளை ஒப்பிடுக

Azure AI இல் மைக்ரோசாப்டின் சமீபத்திய தொழில்நுட்பம் படங்களையும் மக்களையும் விவரிக்கிறது

கெட்டி இமேஜஸ் நூலகத்திலிருந்து புகைப்படம். முந்தைய விளக்கம்: ஒரு கட்டிங் போர்டில் ஹாட் டாக் சமைக்கும் மனிதனின் நெருக்கமான காட்சி. புதிய விளக்கம்: ஒரு மனிதன் ரொட்டி செய்கிறான்.

Azure AI இல் மைக்ரோசாப்டின் சமீபத்திய தொழில்நுட்பம் படங்களையும் மக்களையும் விவரிக்கிறது

கெட்டி இமேஜஸ் நூலகத்திலிருந்து புகைப்படம். முந்தைய விளக்கம்: ஒரு மனிதன் சூரிய அஸ்தமனத்தில் அமர்ந்திருக்கிறான். புதிய விளக்கம்: கடற்கரையில் நெருப்பு.

Azure AI இல் மைக்ரோசாப்டின் சமீபத்திய தொழில்நுட்பம் படங்களையும் மக்களையும் விவரிக்கிறது

கெட்டி இமேஜஸ் நூலகத்திலிருந்து புகைப்படம். முந்தைய விளக்கம்: நீல நிற சட்டை அணிந்த ஒரு மனிதன். புதிய விளக்கம்: பலர் அறுவை சிகிச்சை முகமூடிகளை அணிந்துள்ளனர்.

Azure AI இல் மைக்ரோசாப்டின் சமீபத்திய தொழில்நுட்பம் படங்களையும் மக்களையும் விவரிக்கிறது

கெட்டி இமேஜஸ் நூலகத்திலிருந்து புகைப்படம். முந்தைய விளக்கம்: ஸ்கேட்போர்டில் ஒரு மனிதன் சுவரில் பறக்கிறான். புதிய விளக்கம்: ஒரு பேஸ்பால் வீரர் பந்தைப் பிடிக்கிறார்.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்