Fungua msimbo kwa usanisi wa uhuishaji kwa kutumia mitandao ya neva

Kundi la watafiti kutoka Chuo Kikuu cha Ufundi cha Shanghai ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° zana Muigaji, ambayo inaruhusu kutumia mbinu za kujifunza mashine ili kuiga mienendo ya watu kwa kutumia picha tuli, na pia kuchukua nafasi ya nguo, kuzihamisha kwenye mazingira mengine na kubadilisha pembe ambayo kitu kinaonekana. Nambari imeandikwa kwa Python
kwa kutumia mfumo PyTorch. Mkutano pia unahitaji tochi na CUDA Toolkit.

Fungua msimbo kwa usanisi wa uhuishaji kwa kutumia mitandao ya neva

Zana ya zana hupokea picha ya pande mbili kama ingizo na kuunganisha tokeo lililorekebishwa kulingana na muundo uliochaguliwa. Chaguzi tatu za mabadiliko zinaungwa mkono:
Kuunda kitu cha kusonga kinachofuata harakati ambazo mfano huo ulifunzwa. Kuhamisha vipengele vya kuonekana kutoka kwa mfano hadi kitu (kwa mfano, mabadiliko ya nguo). Kizazi cha pembe mpya (kwa mfano, awali ya picha ya wasifu kulingana na picha ya uso kamili). Njia zote tatu zinaweza kuunganishwa, kwa mfano, unaweza kutoa video kutoka kwa picha inayoiga utendaji wa hila tata ya sarakasi katika nguo tofauti.

Wakati wa mchakato wa usanisi, shughuli za kuchagua kitu kwenye picha na kutengeneza vitu vya nyuma vilivyokosekana wakati wa kusonga hufanywa wakati huo huo. Muundo wa mtandao wa neva unaweza kufunzwa mara moja na kutumika kwa mabadiliko mbalimbali. Kwa upakiaji inapatikana mifano iliyotengenezwa tayari ambayo hukuruhusu kutumia zana mara moja bila mafunzo ya awali. GPU yenye ukubwa wa kumbukumbu ya angalau 8GB inahitajika ili kufanya kazi.

Tofauti na mbinu za mageuzi kulingana na ugeuzaji kwa pointi muhimu zinazoelezea eneo la mwili katika nafasi ya pande mbili, Mwigaji hujaribu kuunganisha matundu yenye sura tatu na maelezo ya mwili kwa kutumia mbinu za kujifunza kwa mashine.
Njia iliyopendekezwa inaruhusu kudanganywa kwa kuzingatia sura ya kibinafsi ya mwili na mkao wa sasa, kuiga harakati za asili za viungo.

Fungua msimbo kwa usanisi wa uhuishaji kwa kutumia mitandao ya neva

Ili kuhifadhi habari asili kama vile maumbo, mtindo, rangi na utambuzi wa uso wakati wa mchakato wa mabadiliko, mtandao wa neva wa adversarial (Kioevu Warping GAN) Taarifa kuhusu kitu chanzo na vigezo vya kitambulisho chake sahihi hutolewa kwa kutumia mtandao wa neva wa kubadilisha.


Chanzo: opennet.ru

Kuongeza maoni