La kodo de maŝinlernada sistemo por generi realismajn homajn movadojn estis malfermita

Teamo de esploristoj de la Universitato de Tel-Avivo malfermis la fontkodon asociitan kun la maŝinlernado MDM (Motion Diffusion Model), kiu permesas generi realismajn homajn movojn. La kodo estas skribita en Python uzante la kadron PyTorch kaj estas distribuita sub la MIT-licenco. Por fari eksperimentojn, vi povas uzi ambaŭ pretajn modelojn kaj trejni la modelojn mem uzante la proponitajn skriptojn, ekzemple, uzante la HumanML3D-kolekton de tridimensiaj homaj bildoj. Por trejni la sistemon, necesas GPU kun CUDA-subteno.

La uzo de tradiciaj kapabloj por vigligi homajn movadojn estas malfacila pro la komplikaĵoj asociitaj kun la granda vario de eblaj movadoj kaj la malfacileco de formale priskribi ilin, same kiel la granda sentemo de homa percepto al nenaturaj movadoj. Antaŭaj provoj uzi generajn maŝinlernajn modelojn havis problemojn kun kvalito kaj limigita esprimkapablo.

La proponita sistemo provas uzi disvastigmodelojn por generi movadojn, kiuj estas esence pli taŭgaj por simulado de homaj movadoj, sed ne estas sen malavantaĝoj, kiel ekzemple altaj komputilaj postuloj kaj kontrola komplekseco. Por minimumigi la mankojn de disvastigmodeloj, MDM uzas transformilan neŭralan reton kaj provaĵprognozon anstataŭe de bruoprognozo en ĉiu stadio, faciligante malhelpi anomaliojn kiel ekzemple perdo de surfackontakto kun la piedo.

Por kontroli generacion, eblas uzi tekstan priskribon de ago en natura lingvo (ekzemple, "persono antaŭeniras kaj kliniĝas por preni ion el la tero") aŭ uzi normajn agojn kiel "kuri" kaj " saltante.” La sistemo ankaŭ povas esti uzata por redakti movojn kaj plenigi perditajn detalojn. La esploristoj faris teston, en kiu partoprenantoj estis petitaj elekti pli bonan rezulton el pluraj ebloj - en 42% de kazoj homoj preferis sintezitajn movojn ol realajn.



fonto: opennet.ru

Aldoni komenton