உரை விளக்கத்தின் அடிப்படையில் பட தொகுப்புக்கான இயந்திர கற்றல் முறையை செயல்படுத்துதல்

OpenAI ஆல் முன்மொழியப்பட்ட இயந்திர கற்றல் அமைப்பின் DALL-E 2 இன் திறந்த செயலாக்கம் வெளியிடப்பட்டது, மேலும் இயற்கை மொழியில் உரை விளக்கத்தின் அடிப்படையில் யதார்த்தமான படங்கள் மற்றும் ஓவியங்களை ஒருங்கிணைக்க உங்களை அனுமதிக்கிறது, அத்துடன் படங்களைத் திருத்த இயற்கை மொழியில் கட்டளைகளைப் பயன்படுத்தவும் ( எடுத்துக்காட்டாக, படத்தில் உள்ள பொருட்களைச் சேர்க்கவும், நீக்கவும் அல்லது நகர்த்தவும் ). OpenAI இன் அசல் DALL-E 2 மாதிரிகள் வெளியிடப்படவில்லை, ஆனால் முறையை விவரிக்கும் ஒரு தாள் உள்ளது. தற்போதுள்ள விளக்கத்தின் அடிப்படையில், சுயாதீன ஆராய்ச்சியாளர்கள் பைத்தோனில் எழுதப்பட்ட மாற்று செயலாக்கத்தைத் தயாரித்து, பைடார்ச் கட்டமைப்பைப் பயன்படுத்தி எம்ஐடி உரிமத்தின் கீழ் விநியோகித்துள்ளனர்.

உரை விளக்கத்தின் அடிப்படையில் பட தொகுப்புக்கான இயந்திர கற்றல் முறையை செயல்படுத்துதல்உரை விளக்கத்தின் அடிப்படையில் பட தொகுப்புக்கான இயந்திர கற்றல் முறையை செயல்படுத்துதல்

DALL-E இன் முதல் தலைமுறையின் முன்னர் வெளியிடப்பட்ட செயலாக்கத்துடன் ஒப்பிடுகையில், புதிய பதிப்பு படத்தின் விளக்கத்துடன் மிகவும் துல்லியமான பொருத்தத்தை வழங்குகிறது, அதிக ஒளியியலை அனுமதிக்கிறது மற்றும் அதிக தெளிவுத்திறன்களில் படங்களை உருவாக்குவதை சாத்தியமாக்குகிறது. மாடலைப் பயிற்றுவிக்க கணினிக்கு பெரிய ஆதாரங்கள் தேவை; எடுத்துக்காட்டாக, DALL-E 2 இன் அசல் பதிப்பைப் பயிற்றுவிப்பதற்கு GPU இல் 100-200 ஆயிரம் மணிநேர கணினி தேவைப்படுகிறது, அதாவது. 2 NVIDIA Tesla V4 GPUகளுடன் சுமார் 256-100 வார கணக்கீடுகள்.

உரை விளக்கத்தின் அடிப்படையில் பட தொகுப்புக்கான இயந்திர கற்றல் முறையை செயல்படுத்துதல்

அதே ஆசிரியர் நீட்டிக்கப்பட்ட பதிப்பையும் உருவாக்கத் தொடங்கினார் - DALLE2 வீடியோ, ஒரு உரை விளக்கத்திலிருந்து வீடியோவை ஒருங்கிணைப்பதை நோக்கமாகக் கொண்டது. தனித்தனியாக, ரஷ்ய மொழியில் விளக்கங்களை அங்கீகரிப்பதற்காக மாற்றியமைக்கப்பட்ட முதல் தலைமுறை DALL-E இன் திறந்த செயலாக்கத்துடன், Sberbank உருவாக்கிய ru-dalle திட்டத்தை நாம் கவனிக்கலாம்.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்