Është hapur kodi i një sistemi të mësimit të makinerive për gjenerimin e lëvizjeve realiste njerëzore

Një ekip studiuesish nga Universiteti i Tel Avivit ka hapur kodin burimor të lidhur me sistemin e mësimit të makinerisë MDM (Motion Diffusion Model), i cili lejon gjenerimin e lëvizjeve realiste njerëzore. Kodi është shkruar në Python duke përdorur kornizën PyTorch dhe shpërndahet nën licencën MIT. Për të kryer eksperimente, mund të përdorni të dy modelet e gatshme dhe t'i trajnoni vetë modelet duke përdorur skriptet e propozuara, për shembull, duke përdorur koleksionin HumanML3D të imazheve tredimensionale njerëzore. Për të trajnuar sistemin, kërkohet një GPU me mbështetje CUDA.

Përdorimi i aftësive tradicionale për animimin e lëvizjeve njerëzore është i vështirë për shkak të ndërlikimeve që lidhen me shumëllojshmërinë e madhe të lëvizjeve të mundshme dhe vështirësisë së përshkrimit zyrtar të tyre, si dhe ndjeshmërisë së madhe të perceptimit njerëzor ndaj lëvizjeve të panatyrshme. Përpjekjet e mëparshme për të përdorur modele gjeneruese të mësimit të makinerive kanë pasur probleme me cilësinë dhe ekspresivitetin e kufizuar.

Sistemi i propozuar përpiqet të përdorë modele difuzioni për të gjeneruar lëvizje, të cilat në thelb janë më të përshtatshme për simulimin e lëvizjeve njerëzore, por nuk janë pa të meta, siç janë kërkesat e larta llogaritëse dhe kompleksiteti i kontrollit. Për të minimizuar mangësitë e modeleve të difuzionit, MDM përdor një rrjet nervor transformatori dhe parashikimin e mostrës në vend të parashikimit të zhurmës në çdo fazë, duke e bërë më të lehtë parandalimin e anomalive të tilla si humbja e kontaktit sipërfaqësor me këmbën.

Për të kontrolluar gjenerimin, është e mundur të përdoret një përshkrim teksti i një veprimi në gjuhën natyrore (për shembull, "një person ecën përpara dhe përkulet për të marrë diçka nga toka") ose të përdorni veprime standarde si "vrapimi" dhe " duke kërcyer.” Sistemi mund të përdoret gjithashtu për të redaktuar lëvizjet dhe për të plotësuar detajet e humbura. Studiuesit kryen një test në të cilin pjesëmarrësve iu kërkua të zgjidhnin një rezultat më të mirë nga disa opsione - në 42% të rasteve, njerëzit preferonin lëvizjet e sintetizuara mbi ato reale.



Burimi: opennet.ru

Shto një koment