ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී

ස්ථායිතා AI විසින් යෝජිත අච්චුවක් හෝ ස්වභාවික භාෂා පෙළ විස්තරයක් මත පදනම්ව රූප සංස්ලේෂණය කිරීමට සහ වෙනස් කිරීමට හැකියාව ඇති Stable Diffusion යන්ත්‍ර ඉගෙනුම් පද්ධතියේ දෙවන සංස්කරණය ප්‍රකාශයට පත් කර ඇත. ස්නායුක ජාල පුහුණුව සහ රූප උත්පාදනය සඳහා මෙවලම් කේතය PyTorch රාමුව භාවිතයෙන් Python හි ලියා MIT බලපත්‍රය යටතේ ප්‍රකාශයට පත් කර ඇත. වාණිජමය භාවිතයට ඉඩ සලසන Creative ML OpenRAIL-M අවසර බලපත්‍රය යටතේ දැනටමත් පුහුණු කරන ලද ආකෘති විවෘතව ඇත. මීට අමතරව, demo online image generator එකක් තිබේ.

ස්ථායී විසරණයේ නව සංස්කරණයේ ප්‍රධාන වැඩිදියුණු කිරීම්:

  • පෙළ විස්තරය මත පදනම්ව රූප සංස්ලේෂණය සඳහා නව මාදිලියක් - SD2.0-v - නිර්මාණය කර ඇති අතර, එය 768×768 විභේදනයක් සහිත රූප උත්පාදනය කිරීමට සහාය වේ. නව මාදිලිය පෙළ විස්තර සහිත රූප බිලියන 5 ක LAION-5.85B එකතුව භාවිතයෙන් පුහුණු කරන ලදී. මෙම ආකෘතිය ස්ථායී විසරණ 1.5 ආකෘතියට සමාන පරාමිති කට්ටලයක් භාවිතා කරයි, නමුත් මූලික වශයෙන් වෙනස් OpenCLIP-ViT/H කේතකයක් භාවිතා කිරීමට සංක්‍රමණය වීම මගින් වෙනස් වේ, එමඟින් ලැබෙන රූපවල ගුණාත්මක භාවය සැලකිය යුතු ලෙස වැඩිදියුණු කිරීමට හැකි විය.
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
  • සරල කරන ලද SD2.0-පාදක අනුවාදයක් සකස් කර ඇති අතර, සම්භාව්‍ය ශබ්ද පුරෝකථන ආකෘතිය සහ 256×256 විභේදනයක් සහිත රූප උත්පාදනය සඳහා සහාය වන රූප 512×512 මත පුහුණු කර ඇත.
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
  • සුපිරි නියැදීමේ තාක්ෂණය (සුපිරි විභේදනය) භාවිතා කිරීමේ හැකියාව ලබා දී ඇත්තේ ගුණාත්මකභාවය අඩු නොකර මුල් රූපයේ විභේදනය වැඩි කිරීම, අවකාශීය පරිමාණය සහ විස්තර ප්‍රතිනිර්මාණය කිරීම සඳහා ඇල්ගොරිතම භාවිතා කිරීමයි. සපයා ඇති රූප සැකසුම් ආකෘතිය (SD20-upscaler) 2048×2048 විභේදනයකින් රූප උත්පාදනය කළ හැකි XNUMXx upscaling සඳහා සහය දක්වයි.
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
  • SD2.0-depth2img ආකෘතිය යෝජනා කර ඇත, එය වස්තූන්ගේ ගැඹුර සහ අවකාශීය සැකැස්ම සැලකිල්ලට ගනී. MiDaS පද්ධතිය ඒකක ගැඹුර තක්සේරු කිරීම සඳහා භාවිතා වේ. මුල් පිටපතට වඩා රැඩිකල් ලෙස වෙනස් විය හැකි නමුත් සමස්ත සංයුතිය හා ගැඹුර රඳවා තබා ගන්නා අච්චුවක් ලෙස වෙනත් රූපයක් භාවිතා කරමින් නව රූප සංස්ලේෂණය කිරීමට මෙම ආකෘතිය ඔබට ඉඩ සලසයි. උදාහරණයක් ලෙස, ඔබට ඡායාරූපයක සිටින පුද්ගලයෙකුගේ ඉරියව්ව භාවිතා කර එම ඉරියව්වෙන්ම තවත් චරිතයක් සෑදිය හැකිය.
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
  • පින්තූර වෙනස් කිරීම සඳහා වන ආකෘතිය යාවත්කාලීන කර ඇත - SD 2.0-inpainting, ඔබට පෙළ විමසුම් භාවිතයෙන් රූපයේ කොටස් ප්‍රතිස්ථාපනය කිරීමට සහ වෙනස් කිරීමට ඉඩ සලසයි.
    ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී
  • තනි GPU එකක් සහිත සාම්ප්‍රදායික පද්ධතිවල භාවිතය සඳහා මාදිලි ප්‍රශස්ත කර ඇත.

ස්ථායී විසරණය 2.0 රූප සංශ්ලේෂණ පද්ධතිය හඳුන්වා දෙන ලදී


මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න