Kóðinn fyrir vélanámskerfi til að búa til raunhæfar hreyfingar manna hefur verið opnaður

Hópur vísindamanna frá Tel Aviv háskólanum hefur opnað frumkóðann sem tengist MDM (Motion Diffusion Model) vélanámskerfinu, sem gerir kleift að búa til raunhæfar hreyfingar manna. Kóðinn er skrifaður í Python með PyTorch ramma og er dreift undir MIT leyfinu. Til að gera tilraunir geturðu notað bæði tilbúin líkön og þjálfað líkönin sjálfur með því að nota fyrirhugaðar forskriftir, til dæmis með því að nota HumanML3D safn þrívíddar mannamynda. Til að þjálfa kerfið þarf GPU með CUDA stuðningi.

Notkun hefðbundinna hæfileika til að lífga hreyfingar manna er erfið vegna þeirra fylgikvilla sem fylgja hinum mikla fjölbreytni mögulegra hreyfinga og erfiðleika við að lýsa þeim formlega, auk þess hversu næm skynjun mannsins er fyrir óeðlilegum hreyfingum. Fyrri tilraunir til að nota skapandi vélanámslíkön hafa átt í vandræðum með gæði og takmarkaða tjáningu.

Fyrirhugað kerfi reynir að nota dreifingarlíkön til að búa til hreyfingar, sem eru í eðli sínu betur til þess fallnar að líkja eftir hreyfingum manna, en eru ekki án galla, svo sem miklar reiknikröfur og flókið eftirlit. Til að lágmarka galla dreifingarlíkana notar MDM taugakerfi spenni og sýnishornsspá í stað hávaðaspár á hverju stigi, sem gerir það auðveldara að koma í veg fyrir frávik eins og tap á yfirborðssnertingu við fótinn.

Til að stjórna kynslóðinni er hægt að nota textalýsingu á aðgerð á náttúrulegu tungumáli (til dæmis „maður gengur fram og beygir sig niður til að taka eitthvað upp af jörðinni“) eða nota staðlaðar aðgerðir eins og „hlaup“ og „ hoppa.” Kerfið er einnig hægt að nota til að breyta hreyfingum og fylla út glataðar upplýsingar. Rannsakendur gerðu próf þar sem þátttakendur voru beðnir um að velja betri niðurstöðu úr nokkrum valkostum - í 42% tilvika kusu fólk tilbúnar hreyfingar fram yfir raunverulegar.



Heimild: opennet.ru

Bæta við athugasemd