Buksan ang code para sa animation synthesis gamit ang mga neural network

Isang pangkat ng mga mananaliksik mula sa Shanghai Technical University ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° mga kasangkapan Impersonator, na nagbibigay-daan sa paggamit ng mga pamamaraan sa pag-aaral ng makina upang gayahin ang mga paggalaw ng mga tao gamit ang mga static na larawan, gayundin ang pagpapalit ng mga damit, ilipat ang mga ito sa ibang kapaligiran at baguhin ang anggulo kung saan nakikita ang isang bagay. Ang code ay nakasulat sa Python
gamit ang isang balangkas PyTorch. Kinakailangan din ng pagpupulong torchvision at CUDA Toolkit.

Buksan ang code para sa animation synthesis gamit ang mga neural network

Ang toolkit ay tumatanggap ng dalawang-dimensional na imahe bilang input at nag-synthesize ng binagong resulta batay sa napiling modelo. Tatlong opsyon sa pagbabago ang sinusuportahan:
Paglikha ng gumagalaw na bagay na sumusunod sa mga paggalaw kung saan sinanay ang modelo. Paglilipat ng mga elemento ng hitsura mula sa isang modelo patungo sa isang bagay (halimbawa, isang pagbabago ng damit). Pagbuo ng bagong anggulo (halimbawa, synthesis ng isang larawan sa profile batay sa isang full-face na litrato). Ang lahat ng tatlong paraan ay maaaring pagsamahin, halimbawa, maaari kang bumuo ng isang video mula sa isang litrato na ginagaya ang pagganap ng isang kumplikadong acrobatic trick sa iba't ibang damit.

Sa panahon ng proseso ng synthesis, ang mga operasyon ng pagpili ng isang bagay sa isang litrato at pagbuo ng mga nawawalang elemento ng background kapag gumagalaw ay sabay-sabay na isinasagawa. Ang modelo ng neural network ay maaaring sanayin nang isang beses at magamit para sa iba't ibang pagbabago. Para sa paglo-load magagamit handa na mga modelo na nagbibigay-daan sa iyo upang agad na gamitin ang mga tool nang walang paunang pagsasanay. Ang isang GPU na may sukat ng memorya na hindi bababa sa 8GB ay kinakailangan upang gumana.

Hindi tulad ng mga paraan ng pagbabagong-anyo batay sa pagbabagong-anyo sa pamamagitan ng mga pangunahing punto na naglalarawan sa lokasyon ng katawan sa dalawang-dimensional na espasyo, sinusubukan ng Impersonator na mag-synthesize ng three-dimensional na mesh na may paglalarawan ng katawan gamit ang mga pamamaraan ng machine learning.
Ang iminungkahing pamamaraan ay nagbibigay-daan para sa mga manipulasyon na isinasaalang-alang ang personalized na hugis ng katawan at kasalukuyang pustura, na ginagaya ang mga natural na paggalaw ng mga limbs.

Buksan ang code para sa animation synthesis gamit ang mga neural network

Upang mapanatili ang orihinal na impormasyon tulad ng mga texture, istilo, kulay at pagkilala sa mukha sa panahon ng proseso ng pagbabago, generative adversarial neural network (Liquid Warping GAN). Ang impormasyon tungkol sa pinagmulang bagay at mga parameter para sa tumpak na pagkakakilanlan nito ay kinukuha sa pamamagitan ng paglalapat convolutional neural network.


Pinagmulan: opennet.ru

Magdagdag ng komento