Infetaħ il-kodiċi ta' sistema ta' tagħlim tal-magni għall-ġenerazzjoni ta' movimenti umani realistiċi

Tim ta 'riċerkaturi mill-Università ta' Tel Aviv fetaħ il-kodiċi sors assoċjat mas-sistema ta 'tagħlim tal-magni MDM (Motion Diffusion Model), li tippermetti li tiġġenera movimenti umani realistiċi. Il-kodiċi huwa miktub f'Python bl-użu tal-qafas PyTorch u huwa mqassam taħt il-liċenzja MIT. Biex twettaq esperimenti, tista 'tuża kemm mudelli lesti kif ukoll tħarreġ il-mudelli lilek innifsek billi tuża l-iskripts proposti, pereżempju, billi tuża l-ġbir HumanML3D ta' stampi umani tridimensjonali. Biex titħarreġ is-sistema, hija meħtieġa GPU b'appoġġ CUDA.

L-użu ta 'kapaċitajiet tradizzjonali għall-animazzjoni tal-movimenti tal-bniedem huwa diffiċli minħabba l-kumplikazzjonijiet assoċjati mal-varjetà kbira ta' movimenti possibbli u d-diffikultà biex jiġu deskritti formalment, kif ukoll is-sensittività kbira tal-perċezzjoni tal-bniedem għal movimenti mhux naturali. Tentattivi preċedenti biex jintużaw mudelli ġenerattivi ta 'tagħlim tal-magni kellhom problemi ta' kwalità u espressività limitata.

Is-sistema proposta tipprova tuża mudelli ta 'diffużjoni biex tiġġenera movimenti, li huma intrinsikament adattati aħjar għas-simulazzjoni tal-movimenti tal-bniedem, iżda mhumiex mingħajr żvantaġġi, bħal rekwiżiti ta' komputazzjoni għolja u kumplessità ta 'kontroll. Biex timminimizza n-nuqqasijiet tal-mudelli tad-diffużjoni, MDM juża netwerk newrali tat-transformer u tbassir tal-kampjuni minflok tbassir tal-istorbju f'kull stadju, li jagħmilha aktar faċli biex jiġu evitati anomaliji bħal telf ta 'kuntatt tal-wiċċ mas-sieq.

Biex tikkontrolla l-ġenerazzjoni, huwa possibbli li tuża deskrizzjoni test ta’ azzjoni bil-lingwa naturali (pereżempju, “persuna timxi ‘l quddiem u tgħawweġ biex taqbad xi ħaġa mill-art”) jew tuża azzjonijiet standard bħal “ġiri” u “ jaqbeż.” Is-sistema tista 'tintuża wkoll biex teditja movimenti u timla d-dettalji mitlufa. Ir-riċerkaturi wettqu test li fih il-parteċipanti ntalbu jagħżlu riżultat aħjar minn diversi għażliet - fi 42% tal-każijiet, in-nies ippreferew movimenti sintetizzati fuq dawk reali.



Sors: opennet.ru

Żid kumment