Apertura di u codice per a sintesi di l'animazione cù e rete neurali

Un gruppu di circadori da l'Università Tecnica di Shanghai publicatu arnesi Impegnatore, chì permette di utilizà metudi di machine learning per simulà i movimenti di e persone cù l'imaghjini statichi, è ancu di rimpiazzà i vestiti, trasfirìuli à un altru ambiente è cambia l'angolo da quale un ughjettu hè visibile. U codice hè scrittu in Python
usendu un quadru PyTorch. L'assemblea richiede ancu torchvision è CUDA Toolkit.

Apertura di u codice per a sintesi di l'animazione cù e rete neurali

U toolkit riceve una maghjina bidimensionale cum'è input è sintetizza un risultatu mudificatu basatu annantu à u mudellu sceltu. Trè opzioni di trasfurmazioni sò supportate:
Crià un ughjettu in muvimentu chì seguita i muvimenti nantu à quale u mudellu hè statu furmatu. Trasferendu elementi di l'apparenza da un mudellu à un ughjettu (per esempiu, un cambiamentu di vestiti). Generazione di un novu angulu (per esempiu, sintesi di una maghjina di prufilu basatu annantu à una fotografia full-face). Tutti i trè metudi ponu esse cumminati, per esempiu, pudete generà un video da una fotografia chì simula u funziunamentu di un truccu acrobaticu cumplessu in diversi vestiti.

Duranti u prucessu di sintesi, l'operazioni di selezziunà un ughjettu in una fotografia è furmendu l'elementi di fondo mancanti quandu si move sò realizati simultaneamente. U mudellu di rete neurale pò esse furmatu una volta è utilizatu per diverse trasfurmazioni. Per carica dispunibule mudelli pronti chì permettenu di utilizà immediatamente l'arnesi senza furmazione preliminare. Una GPU cù una dimensione di memoria di almenu 8GB hè necessariu per operare.

A cuntrariu di i metudi di trasfurmazioni basati nantu à a trasfurmazioni per punti chjave chì descrizanu u locu di u corpu in u spaziu bidimensionale, Impersonator prova di sintetizà una maglia tridimensionale cù una descrizzione di u corpu utilizendu metudi d'apprendimentu machine.
U metudu prupostu permette manipulazioni in cunsiderà a forma di u corpu persunalizatu è a postura attuale, simulendu i movimenti naturali di i membri.

Apertura di u codice per a sintesi di l'animazione cù e rete neurali

Per priservà l'infurmazioni originali cum'è texture, stile, culori è ricunniscenza faciale durante u prucessu di trasfurmazioni, rete neurale generativa avversaria (Liquid Warping GAN). L'infurmazioni nantu à l'ughjettu fonte è i paràmetri per a so identificazione precisa sò estratti da l'applicazione rete neurale cunvoluzionale.


Source: opennet.ru

Add a comment