Iepen koade foar animaasjesynteze mei neurale netwurken

In groep ûndersikers fan Shanghai Technical University publisearre ark Impersonator, wêrtroch it brûken fan masine-learmetoaden mooglik makket om bewegingen fan minsken te simulearjen mei statyske bylden, en ek klean te ferfangen, se oer te bringen nei in oare omjouwing en de hoeke te feroarjen wêrút in objekt sichtber is. De koade is skreaun yn Python
mei help fan in ramt PyTorch. Gearstalling ek fereasket fakkelvision en CUDA Toolkit.

Iepen koade foar animaasjesynteze mei neurale netwurken

De toolkit ûntfangt in twadiminsjonale ôfbylding as ynfier en synthesizes in wizige resultaat basearre op it selektearre model. Trije transformaasjeopsjes wurde stipe:
It meitsjen fan in bewegend foarwerp dat folget de bewegingen dêr't it model waard oplaat. It oerdragen fan eleminten fan uterlik fan in model nei in objekt (bygelyks in feroaring fan klean). Generaasje fan in nije hoeke (bygelyks synteze fan in profylôfbylding basearre op in folsleine foto). Alle trije metoaden kinne wurde kombinearre, bygelyks kinne jo in fideo generearje fan in foto dy't de prestaasjes fan in komplekse akrobatyske trúk yn ​​ferskate klean simulearret.

Tidens it syntezeproses wurde de operaasjes fan it selektearjen fan in objekt yn in foto en it foarmjen fan de ûntbrekkende eftergrûneleminten by it ferpleatsen tagelyk útfierd. It neuronale netwurkmodel kin ien kear wurde traind en brûkt foar ferskate transformaasjes. Foar it laden beskikber ready-made modellen wêrtroch jo de ark direkt kinne brûke sûnder foarriedige training. In GPU mei in ûnthâldgrutte fan op syn minst 8GB is nedich om te operearjen.

Oars as transformaasjemetoaden basearre op transformaasje troch wichtige punten dy't de lokaasje fan it lichem beskriuwe yn twadimensjonale romte, besiket Impersonator in trijediminsjonale gaas te synthesisearjen mei in beskriuwing fan it lichem mei metoaden foar learen fan masines.
De foarstelde metoade soarget foar manipulaasjes mei rekken hâldend mei de persoanlike lichemsfoarm en hjoeddeistige posysje, simulearje de natuerlike bewegingen fan 'e ledematen.

Iepen koade foar animaasjesynteze mei neurale netwurken

Om orizjinele ynformaasje te behâlden lykas tekstueren, styl, kleuren en gesichtsherkenning tidens it transformaasjeproses, generatyf adversarial neural netwurk (Liquid Warping GAN). Ynformaasje oer it boarneobjekt en parameters foar har krekte identifikaasje wurde ekstrahearre troch tapassen convolutional neural netwurk.


Boarne: opennet.ru

Add a comment