HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော

Tel Aviv တက္ကသိုလ်မှ သုတေသီအဖွဲ့တစ်ဖွဲ့သည် အစစ်အမှန်ပုံများကို တည်းဖြတ်ရာတွင် ပျောက်ဆုံးနေသော အစိတ်အပိုင်းများကို ပြန်လည်ဖန်တီးရန် NVIDIA ၏ StyleGAN2 စက်သင်ယူမှုစနစ်၏ ပြောင်းပြန်ဗားရှင်း HyperStyle ကို တင်ပြခဲ့သည်။ ကုဒ်ကို Python တွင် PyTorch မူဘောင်ကို အသုံးပြု၍ ရေးသားထားပြီး MIT လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။

StyleGAN သည် အသက်၊ ကျား၊ မ၊ ဆံပင်အရှည်၊ အပြုံးဇာတ်ကောင်၊ နှာခေါင်းပုံသဏ္ဍာန်၊ အရေပြားအရောင်၊ မျက်မှန်နှင့် ဓာတ်ပုံထောင့်စသည့် ဘောင်များကို သတ်မှတ်ခြင်းဖြင့် လက်တွေ့ဆန်သော မျက်နှာသစ်များကို ပေါင်းစပ်နိုင်စေမည်ဆိုလျှင် HyperStyle သည် ရှိရင်းစွဲအလားတူ ဘောင်များကို ပြောင်းလဲနိုင်စေပါသည်။ မူရင်းမျက်နှာကို အသိအမှတ်ပြုမှုကို ထိန်းသိမ်းထားစဉ် ၎င်းတို့၏ လက္ခဏာအင်္ဂါရပ်များကို မပြောင်းလဲဘဲ ဓာတ်ပုံရိုက်ကူးပါ။ ဥပမာအားဖြင့်၊ HyperStyle ကို အသုံးပြု၍ ဓာတ်ပုံတစ်ပုံတွင် လူတစ်ဦး၏အသက်အရွယ်ပြောင်းလဲမှုကို ပုံဖော်နိုင်သည်၊ ဆံပင်ပုံစံကို ပြောင်းလဲခြင်း၊ မျက်မှန်၊ မုတ်ဆိတ်မွေး သို့မဟုတ် နှုတ်ခမ်းမွေးများထည့်ခြင်း၊ ရုပ်ပုံအား ကာတွန်းဇာတ်ကောင် သို့မဟုတ် လက်ဆွဲပန်းချီများ ဖန်တီးခြင်း၊ ဝမ်းနည်းစရာ သို့မဟုတ် ရွှင်လန်းသော မျက်နှာအမူအရာ။ ထို့အပြင်၊ စနစ်သည် လူများ၏မျက်နှာများကို ပြောင်းလဲရန်သာမက၊ ဥပမာ၊ ကားပုံများကို တည်းဖြတ်ရန် မည်သည့်အရာဝတ္ထုအတွက်မဆို လေ့ကျင့်နိုင်သည်။

HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော

အဆိုပြုထားသောနည်းလမ်းသည် တည်းဖြတ်နေစဉ်အတွင်း ရုပ်ပုံတစ်ပုံ၏ ပျောက်ဆုံးနေသော အစိတ်အပိုင်းများကို ပြန်လည်တည်ဆောက်ခြင်းပြဿနာကို ဖြေရှင်းရန်အတွက် ရည်ရွယ်သည်။ ယခင်က အဆိုပြုထားသော နည်းလမ်းများတွင်၊ ပြန်လည်တည်ဆောက်ခြင်းနှင့် တည်းဖြတ်နိုင်မှုအကြား အပေးအယူကို အစပိုင်းတွင် ပြင်လို့မရသော ဒေသများကို ပြန်လည်ဖန်တီးသည့်အခါ ပစ်မှတ်ပုံ၏ အစိတ်အပိုင်းများကို အစားထိုးရန်အတွက် ပုံမီးစက်ကို ကောင်းစွာချိန်ညှိခြင်းဖြင့် ဖြေရှင်းခဲ့သည်။ ထိုသို့သောချဉ်းကပ်မှုများ၏အားနည်းချက်မှာ ပုံတစ်ပုံချင်းစီအတွက် အာရုံကြောကွန်ရက်၏ ရေရှည်ပစ်မှတ်ထားလေ့ကျင့်မှု လိုအပ်ခြင်းပင်ဖြစ်သည်။

StyleGAN အယ်လဂိုရီသမ်ကို အခြေခံသည့် နည်းလမ်းသည် ပုံများ၏ ဘုံစုစည်းမှုများတွင် ကြိုတင်လေ့ကျင့်ထားသည့် စံမော်ဒယ်ကို အသုံးပြုရန်၊ မော်ဒယ်တစ်ခုစီအတွက် တစ်ဦးချင်းလေ့ကျင့်ရန် လိုအပ်သည့် အယ်လဂိုရီသမ်များနှင့် နှိုင်းယှဉ်နိုင်သော ယုံကြည်စိတ်ချရမှုအဆင့်ဖြင့် မူရင်းပုံ၏ အင်္ဂါရပ်လက္ခဏာများကို ဖန်တီးရန်၊ ပုံ။ နည်းလမ်းအသစ်၏ နောက်ထပ်အားသာချက်တစ်ခုမှာ အချိန်နှင့်တစ်ပြေးညီ နီးပါးစွမ်းဆောင်ရည်ဖြင့် ပုံများကို ပြုပြင်နိုင်မှုဖြစ်သည်။

HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော

Flickr-Faces-HQ (FFHQ၊ 70 အရည်အသွေးမြင့် PNG ပုံများ)၊ Stanford Cars (ကားပုံ 16) နှင့် Stanford Cars (ကားပုံ XNUMX) တို့ကို အခြေခံ၍ အဆင်သင့်လုပ်ထားသော လေ့ကျင့်သင်ကြားထားသော မော်ဒယ်များကို ပြင်ဆင်ထားပါသည်။ AFHQ (တိရစ္ဆာန်များ၏ဓာတ်ပုံများ)။ ထို့အပြင်၊ သင့်မော်ဒယ်များကို လေ့ကျင့်ရန် ကိရိယာများအပြင် ၎င်းတို့နှင့် အသုံးပြုရန် သင့်လျော်သည့် စံကုဒ်နံပါတ်နှင့် ဂျင်နရေတာများ၏ အဆင်သင့်လုပ်ထားသော လေ့ကျင့်ထားသော မော်ဒယ်များကို ပံ့ပိုးပေးပါသည်။ ဥပမာအားဖြင့်၊ Toonify စတိုင်ရုပ်ပုံများ၊ Pixar ဇာတ်ကောင်များဖန်တီးခြင်း၊ ပုံကြမ်းများဖန်တီးခြင်းနှင့် Disney ကာတွန်းများမှ မင်းသမီးများကို စတိုင်ကျစေသည့်တိုင် ဂျင်နရေတာများကို ရရှိနိုင်သည်။

HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော
HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော
HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော
HyperStyle - ရုပ်ပုံတည်းဖြတ်မှုအတွက် StyleGAN စက်သင်ယူမှုစနစ်၏ လိုက်လျောညီထွေဖြစ်သော


source: opennet.ru

မှတ်ချက် Add