ස්වාභාවික භාෂාවෙන් පෙළ විස්තරයක් මත පදනම්ව රූප සංස්ලේෂණය කරන ස්ථායී විසරණ යන්ත්ර ඉගෙනුම් පද්ධතියට අදාළ වර්ධනයන් සොයා ගෙන ඇත. මෙම ව්යාපෘතිය Stability AI සහ Runway, Eleuther AI සහ LAION ප්රජාවන් සහ CompVis විද්යාගාර සමූහය (Munich විශ්ව විද්යාලයේ පරිගණක දැක්ම සහ යන්ත්ර ඉගෙනුම් පර්යේෂණාගාරයක්) හි පර්යේෂකයන් විසින් ඒකාබද්ධව සංවර්ධනය කෙරේ. හැකියාවන් සහ ප්රතිඵලයේ ගුණාත්මක මට්ටම අනුව, ස්ථායී විසරණය DALL-E 2 ව්යාපෘතියට සමාන නමුත් විවෘත සහ ප්රසිද්ධියේ ලබා ගත හැකි ලෙස සංවර්ධනය වෙමින් පවතී. ස්ථායී විසරණය ක්රියාත්මක කිරීම Python වලින් ලියා MIT බලපත්රය යටතේ බෙදා හරිනු ලැබේ.
අධ්යාපන ආයතන සහ ස්වාධීන පර්යේෂකයින් වෙත වෙනම ඉල්ලීමක් මත සූදානම් කළ ආකෘති දැනට ලබා ගත හැකි නමුත්, පරීක්ෂණ අවසන් වූ පසු සහ පළමු නිකුතුව සූදානම් වූ පසු ඒවා සෑම කෙනෙකුටම විවෘත කිරීමට සංවර්ධකයින් පොරොන්දු වේ. පද්ධතිය පුහුණු කිරීම සඳහා, NVIDIA A4000 Ezra-100 GPUs 1 ක පොකුරක් සහ පෙළ විස්තර සහිත රූප බිලියන 5 ක් ඇතුළුව LAION-5.85B එකතුවක් භාවිතා කරන ලදී. රූප උත්පාදනය සඳහා වන සංරචක පරිශීලක පද්ධති මත වැඩ කිරීමට තරම් සැහැල්ලු බව සටහන් කර ඇත; උදාහරණයක් ලෙස, 512x512 විභේදනයකින් රූප සංස්ලේෂණය කිරීමට, පද්ධතියේ 10GB වීඩියෝ මතකයක් සහිත GPU ප්රමාණවත් වේ.



පෙළ විස්තර මත පදනම්ව රූප සංස්ලේෂණය කිරීමට අමතරව, පින්තූර වෙනස් කිරීම සඳහා විකල්පයක් ඉදිරිපත් කරනු ලැබේ, එමඟින් පැහැදිලි කිරීමේ පෙළ විමසීම් භාවිතයෙන්, ක්රමානුරූප කටු සටහන් වලින් පින්තූර ජනනය කිරීමට, පින්තූර සංස්කරණය කිරීමට සහ වෙනස් කිරීමට හෝ විශාලනය කිරීමේදී නැතිවූ තොරතුරු ප්රතිසාධන කිරීමට හැකිය. ස්වභාවික භාෂා පෙළ විධාන මත පදනම්ව වීඩියෝ සංස්කරණය සඳහා ස්ථාවර විසරණය ද සංවර්ධනය වෙමින් පවතී.


මූලාශ්රය: opennet.ru
