Atviras kodas animacijos sintezei naudojant neuroninius tinklus

Mokslininkų grupė iš Šanchajaus technikos universiteto опубликовала įrankiai Imponentas, kuri leidžia naudojant mašininio mokymosi metodus imituoti žmonių judesius naudojant statinius vaizdus, ​​taip pat pakeisti drabužius, perkelti juos į kitą aplinką ir keisti objekto matomumo kampą. Kodas parašytas Python
naudojant karkasą „PyTorch“. Surinkimas taip pat reikalauja deglo vizija ir CUDA įrankių rinkinys.

Atviras kodas animacijos sintezei naudojant neuroninius tinklus

Įrankių rinkinys kaip įvestį gauna dvimatį vaizdą ir sintezuoja modifikuotą rezultatą pagal pasirinktą modelį. Palaikomos trys transformacijos parinktys:
Sukurti judantį objektą, kuris seka judesius, kuriais buvo mokomas modelis. Išvaizdos elementų perkėlimas iš modelio į objektą (pavyzdžiui, drabužių keitimas). Naujo kampo generavimas (pavyzdžiui, profilio vaizdo sintezė remiantis viso veido nuotrauka). Visus tris metodus galima derinti, pavyzdžiui, iš nuotraukos galite sukurti vaizdo įrašą, imituojantį sudėtingo akrobatinio triuko atlikimą skirtingais drabužiais.

Sintezės metu vienu metu atliekamos objekto nuotraukoje parinkimo ir judant trūkstamų fono elementų formavimo operacijos. Neuroninio tinklo modelį galima išmokyti vieną kartą ir naudoti įvairioms transformacijoms. Dėl pakrovimo prieinama paruošti modeliai, leidžiantys iš karto naudoti įrankius be išankstinio mokymo. Kad veiktų, reikalingas GPU, kurio atmintis yra bent 8 GB.

Skirtingai nuo transformacijos metodų, pagrįstų transformacija pagrindiniais taškais, apibūdinančiais kūno vietą dvimatėje erdvėje, „Impersonator“ bando susintetinti trimatį tinklelį su kūno aprašymu, naudodamas mašininio mokymosi metodus.
Siūlomas metodas leidžia atlikti manipuliacijas atsižvelgiant į individualizuotą kūno formą ir esamą laikyseną, imituojant natūralius galūnių judesius.

Atviras kodas animacijos sintezei naudojant neuroninius tinklus

Norėdami išsaugoti originalią informaciją, tokią kaip tekstūros, stilius, spalvos ir veido atpažinimas transformacijos proceso metu, generatyvinis priešiškas neuroninis tinklas (Skysčio deformacija GAN). Informacija apie šaltinio objektą ir parametrai jo tiksliam identifikavimui išgaunami taikant konvoliucinis neuroninis tinklas.


Šaltinis: opennet.ru

Добавить комментарий