HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම

Tel Aviv විශ්ව විද්‍යාලයේ පර්යේෂකයන් කණ්ඩායමක් විසින් HyperStyle ඉදිරිපත් කරන ලදී, එය NVIDIA හි StyleGAN2 යන්ත්‍ර ඉගෙනුම් පද්ධතියේ ප්‍රතිලෝම අනුවාදයක් වන අතර එය සැබෑ රූප සංස්කරණය කිරීමේදී නැතිවූ කොටස් ප්‍රතිනිර්මාණය කිරීමට ප්‍රතිනිර්මාණය කර ඇත. කේතය PyTorch රාමුව භාවිතයෙන් Python වලින් ලියා ඇති අතර MIT බලපත්‍රය යටතේ බෙදා හරිනු ලැබේ.

StyleGAN ඔබට වයස, ස්ත්‍රී පුරුෂ භාවය, හිසකෙස් දිග, සිනහව, නාසයේ හැඩය, සමේ වර්ණය, කණ්නාඩි සහ ඡායාරූප කෝණය වැනි පරාමිතීන් නියම කිරීමෙන් මිනිසුන්ගේ යථාර්ථවාදී පෙනුමක් ඇති නව මුහුණු සංස්ලේෂණය කිරීමට ඉඩ දෙන්නේ නම්, HyperStyle මඟින් දැනට පවතින සමාන පරාමිතීන් වෙනස් කිරීමට හැකි වේ. මුල් මුහුණේ හඳුනාගැනීම පවත්වා ගනිමින් ඒවායේ ලක්ෂණ වෙනස් නොකර ඡායාරූප. උදාහරණයක් ලෙස, HyperStyle භාවිතයෙන්, ඔබට ඡායාරූපයක පුද්ගලයෙකුගේ වයසේ වෙනසක් අනුකරණය කළ හැකිය, කොණ්ඩා මෝස්තරය වෙනස් කරන්න, කණ්නාඩි, රැවුලක් හෝ උඩු රැවුලක් එකතු කරන්න, රූපයට කාටූන් චරිතයක් හෝ අතින් අඳින ලද සිතුවමක් ලබා දෙන්න, කරන්න. දුක්බර හෝ ප්‍රීතිමත් මුහුණේ ඉරියව්වක්. එපමණක් නොව, මිනිසුන්ගේ මුහුණු වෙනස් කිරීමට පමණක් නොව, ඕනෑම වස්තුවක් සඳහා, උදාහරණයක් ලෙස, මෝටර් රථවල පින්තූර සංස්කරණය කිරීමට පද්ධතිය පුහුණු කළ හැකිය.

HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම

යෝජිත ක්‍රමය සංස්කරණය කිරීමේදී රූපයේ නැතිවූ කොටස් ප්‍රතිනිර්මාණය කිරීමේ ගැටළුව විසඳීම අරමුණු කර ගෙන ඇත. කලින් යෝජිත ක්‍රම වලදී, ප්‍රතිනිර්මාණය සහ සංස්කරණය කිරීමේ හැකියාව අතර ඇති ගනුදෙනුව විසඳනු ලැබුවේ මුලින් අතුරුදහන් වූ සංස්කරණය කළ හැකි කලාප ප්‍රතිනිර්මාණය කිරීමේදී ඉලක්කගත රූපයේ කොටස් ආදේශ කිරීම සඳහා රූප උත්පාදක යන්ත්‍රය මනාව සුසර කිරීමෙනි. එවැනි ප්රවේශයන්ගේ අවාසිය නම් එක් එක් රූපය සඳහා ස්නායු ජාලයේ දිගුකාලීන ඉලක්කගත පුහුණුවක් අවශ්ය වේ.

StyleGAN ඇල්ගොරිතම මත පදනම් වූ ක්‍රමය මඟින් එක් එක් ආකෘතියේ තනි පුද්ගල පුහුණුවක් අවශ්‍ය ඇල්ගොරිතම හා සැසඳිය හැකි විශ්වසනීයත්වයේ මට්ටමක් සහිත මුල් රූපයේ ලක්ෂණ ජනනය කිරීම සඳහා සාමාන්‍ය රූප එකතුව මත පූර්ව පුහුණු වූ සම්මත ආකෘතියක් භාවිතා කිරීමට හැකි වේ. රූප. නව ක්‍රමයේ තවත් වාසියක් වන්නේ තත්‍ය කාලයට ආසන්න කාර්ය සාධනයක් සහිත රූප වෙනස් කිරීමේ හැකියාවයි.

HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම

Flickr-Faces-HQ (FFHQ, මිනිසුන්ගේ මුහුණුවල උසස් තත්ත්වයේ PNG පින්තූර 70), ස්ටැන්ෆර්ඩ් කාර් (මෝටර් රථවල පින්තූර 16 දහසක්) සහ එකතු කිරීම් මත පදනම්ව මිනිසුන්, මෝටර් රථ සහ සතුන්ගේ මුහුණු සඳහා සූදානම් කළ පුහුණු ආකෘති සකස් කර ඇත. AFHQ (සතුන්ගේ ඡායාරූප). මීට අමතරව, ඔබේ ආකෘති පුහුණු කිරීම සඳහා මෙවලම් සපයනු ලැබේ, එසේම ඒවා සමඟ භාවිතා කිරීමට සුදුසු සම්මත කේතීකරණ සහ ජනක යන්ත්‍රවල සූදානම් කළ පුහුණු ආකෘති ද සපයනු ලැබේ. උදාහරණයක් ලෙස, ටූනිෆයි ආකාරයේ රූප, පික්සාර් චරිත, රූප සටහන් ජනනය කිරීම සහ ඩිස්නි කාටූන් වලින් කුමාරිකාවන් හැඩගැන්වීම සඳහා උත්පාදක යන්ත්‍ර තිබේ.

HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම
HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම
HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම
HyperStyle - රූප සංස්කරණය සඳහා StyleGAN යන්ත්‍ර ඉගෙනුම් පද්ධතිය අනුවර්තනය කිරීම


මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න