පෙළ විස්තරය මත පදනම්ව රූප සංස්ලේෂණය සඳහා යන්ත්‍ර ඉගෙනුම් පද්ධතියක් ක්‍රියාත්මක කිරීම

OpenAI විසින් යෝජනා කරන ලද DALL-E 2 යන්ත්‍ර ඉගෙනුම් පද්ධතිය විවෘතව ක්‍රියාත්මක කිරීම ප්‍රකාශයට පත් කර ඇති අතර ඔබට ස්වභාවික භාෂාවෙන් පෙළ විස්තරයක් මත පදනම්ව යථාර්ථවාදී රූප සහ සිතුවම් සංස්ලේෂණය කිරීමට මෙන්ම පින්තූර සංස්කරණය කිරීමට ස්වභාවික භාෂාවෙන් විධාන යෙදීමටද ඉඩ සලසයි ( උදාහරණයක් ලෙස, රූපයේ ඇති වස්තූන් එකතු කිරීම, මකා දැමීම හෝ ගෙන යාම ). OpenAI හි මුල් DALL-E 2 මාදිලි ප්‍රකාශයට පත් කර නැත, නමුත් ක්‍රමය විස්තර කරන පත්‍රිකාවක් තිබේ. පවතින විස්තරය මත පදනම්ව, ස්වාධීන පර්යේෂකයන් විසින් Python හි ලියා ඇති විකල්ප ක්‍රියාත්මක කිරීමක් සකස් කර, Pytorch රාමුව භාවිතා කර MIT බලපත්‍රය යටතේ බෙදා හැර ඇත.

පෙළ විස්තරය මත පදනම්ව රූප සංස්ලේෂණය සඳහා යන්ත්‍ර ඉගෙනුම් පද්ධතියක් ක්‍රියාත්මක කිරීමපෙළ විස්තරය මත පදනම්ව රූප සංස්ලේෂණය සඳහා යන්ත්‍ර ඉගෙනුම් පද්ධතියක් ක්‍රියාත්මක කිරීම

DALL-E හි පළමු පරම්පරාවේ කලින් ප්‍රකාශිත ක්‍රියාත්මක කිරීම හා සසඳන විට, නව අනුවාදය විස්තරයට රූපයේ වඩාත් නිවැරදි ගැලපීමක් සපයයි, වැඩි ප්‍රභා යථාර්ථවාදයට ඉඩ සලසයි සහ ඉහළ විභේදනයකින් රූප ජනනය කිරීමට හැකි වේ. ආකෘතිය පුහුණු කිරීම සඳහා පද්ධතියට විශාල සම්පත් අවශ්‍ය වේ; උදාහරණයක් ලෙස, DALL-E 2 හි මුල් අනුවාදය පුහුණු කිරීම සඳහා GPU මත පැය 100-200 ක පරිගණක ගත කිරීම අවශ්‍ය වේ, i.e. NVIDIA Tesla V2 GPU 4ක් සමඟ සති 256-100ක පමණ ගණනය කිරීම්.

පෙළ විස්තරය මත පදනම්ව රූප සංස්ලේෂණය සඳහා යන්ත්‍ර ඉගෙනුම් පද්ධතියක් ක්‍රියාත්මක කිරීම

එම කතුවරයා විසින්ම විස්තීරණ අනුවාදයක් ද සංවර්ධනය කිරීමට පටන් ගත්තේය - DALLE2 වීඩියෝ, පෙළ විස්තරයකින් වීඩියෝ සංස්ලේෂණය කිරීම අරමුණු කර ගෙන. වෙනමම, රුසියානු භාෂාවෙන් විස්තර හඳුනා ගැනීම සඳහා අනුවර්තනය කරන ලද පළමු පරම්පරාවේ DALL-E විවෘතව ක්‍රියාත්මක කිරීමත් සමඟ Sberbank විසින් සංවර්ධනය කරන ලද ru-dalle ව්‍යාපෘතිය අපට සටහන් කළ හැකිය.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න