ස්ථායිතා AI විසින් යෝජිත අච්චුවක් හෝ ස්වභාවික භාෂා පෙළ විස්තරයක් මත පදනම්ව රූප සංස්ලේෂණය කිරීමට සහ වෙනස් කිරීමට හැකියාව ඇති Stable Diffusion යන්ත්ර ඉගෙනුම් පද්ධතියේ දෙවන සංස්කරණය ප්රකාශයට පත් කර ඇත. ස්නායුක ජාල පුහුණුව සහ රූප උත්පාදනය සඳහා මෙවලම් කේතය PyTorch රාමුව භාවිතයෙන් Python හි ලියා MIT බලපත්රය යටතේ ප්රකාශයට පත් කර ඇත. වාණිජමය භාවිතයට ඉඩ සලසන Creative ML OpenRAIL-M අවසර බලපත්රය යටතේ දැනටමත් පුහුණු කරන ලද ආකෘති විවෘතව ඇත. මීට අමතරව, demo online image generator එකක් තිබේ.
ස්ථායී විසරණයේ නව සංස්කරණයේ ප්රධාන වැඩිදියුණු කිරීම්:
- පෙළ විස්තරය මත පදනම්ව රූප සංස්ලේෂණය සඳහා නව මාදිලියක් - SD2.0-v - නිර්මාණය කර ඇති අතර, එය 768×768 විභේදනයක් සහිත රූප උත්පාදනය කිරීමට සහාය වේ. නව මාදිලිය පෙළ විස්තර සහිත රූප බිලියන 5 ක LAION-5.85B එකතුව භාවිතයෙන් පුහුණු කරන ලදී. මෙම ආකෘතිය ස්ථායී විසරණ 1.5 ආකෘතියට සමාන පරාමිති කට්ටලයක් භාවිතා කරයි, නමුත් මූලික වශයෙන් වෙනස් OpenCLIP-ViT/H කේතකයක් භාවිතා කිරීමට සංක්රමණය වීම මගින් වෙනස් වේ, එමඟින් ලැබෙන රූපවල ගුණාත්මක භාවය සැලකිය යුතු ලෙස වැඩිදියුණු කිරීමට හැකි විය.
- සරල කරන ලද SD2.0-පාදක අනුවාදයක් සකස් කර ඇති අතර, සම්භාව්ය ශබ්ද පුරෝකථන ආකෘතිය සහ 256×256 විභේදනයක් සහිත රූප උත්පාදනය සඳහා සහාය වන රූප 512×512 මත පුහුණු කර ඇත.
- සුපිරි නියැදීමේ තාක්ෂණය (සුපිරි විභේදනය) භාවිතා කිරීමේ හැකියාව ලබා දී ඇත්තේ ගුණාත්මකභාවය අඩු නොකර මුල් රූපයේ විභේදනය වැඩි කිරීම, අවකාශීය පරිමාණය සහ විස්තර ප්රතිනිර්මාණය කිරීම සඳහා ඇල්ගොරිතම භාවිතා කිරීමයි. සපයා ඇති රූප සැකසුම් ආකෘතිය (SD20-upscaler) 2048×2048 විභේදනයකින් රූප උත්පාදනය කළ හැකි XNUMXx upscaling සඳහා සහය දක්වයි.
- SD2.0-depth2img ආකෘතිය යෝජනා කර ඇත, එය වස්තූන්ගේ ගැඹුර සහ අවකාශීය සැකැස්ම සැලකිල්ලට ගනී. MiDaS පද්ධතිය ඒකක ගැඹුර තක්සේරු කිරීම සඳහා භාවිතා වේ. මුල් පිටපතට වඩා රැඩිකල් ලෙස වෙනස් විය හැකි නමුත් සමස්ත සංයුතිය හා ගැඹුර රඳවා තබා ගන්නා අච්චුවක් ලෙස වෙනත් රූපයක් භාවිතා කරමින් නව රූප සංස්ලේෂණය කිරීමට මෙම ආකෘතිය ඔබට ඉඩ සලසයි. උදාහරණයක් ලෙස, ඔබට ඡායාරූපයක සිටින පුද්ගලයෙකුගේ ඉරියව්ව භාවිතා කර එම ඉරියව්වෙන්ම තවත් චරිතයක් සෑදිය හැකිය.
- පින්තූර වෙනස් කිරීම සඳහා වන ආකෘතිය යාවත්කාලීන කර ඇත - SD 2.0-inpainting, ඔබට පෙළ විමසුම් භාවිතයෙන් රූපයේ කොටස් ප්රතිස්ථාපනය කිරීමට සහ වෙනස් කිරීමට ඉඩ සලසයි.
- තනි GPU එකක් සහිත සාම්ප්රදායික පද්ධතිවල භාවිතය සඳහා මාදිලි ප්රශස්ත කර ඇත.
මූලාශ්රය: opennet.ru