Awọn koodu ti eto ẹkọ ẹrọ fun ipilẹṣẹ awọn agbeka eniyan gidi ti ṣii

Ẹgbẹ kan ti awọn oniwadi lati Ile-ẹkọ giga Tel Aviv ti ṣii koodu orisun ti o ni nkan ṣe pẹlu MDM (Motion Diffusion Model) eto ẹkọ ẹrọ, eyiti o fun laaye ni ipilẹṣẹ awọn agbeka eniyan gidi. Awọn koodu ti wa ni kikọ ni Python lilo awọn PyTorch ilana ati ti wa ni pin labẹ awọn MIT iwe-ašẹ. Lati ṣe awọn idanwo, o le lo awọn awoṣe ti o ti ṣetan ati kọ awọn awoṣe funrararẹ ni lilo awọn iwe afọwọkọ ti a dabaa, fun apẹẹrẹ, ni lilo ikojọpọ HumanML3D ti awọn aworan eniyan onisẹpo mẹta. Lati ṣe ikẹkọ eto naa, GPU kan pẹlu atilẹyin CUDA nilo.

Lilo awọn agbara ibile fun iwara awọn agbeka eniyan nira nitori awọn ilolu ti o nii ṣe pẹlu ọpọlọpọ awọn agbeka ti o ṣeeṣe ati iṣoro ti ṣapejuwe wọn ni deede, ati ifamọra nla ti iwo eniyan si awọn agbeka atubotan. Awọn igbiyanju iṣaaju lati lo awọn awoṣe ikẹkọ ẹrọ ti ipilẹṣẹ ti ni awọn iṣoro pẹlu didara ati ikosile to lopin.

Eto ti a dabaa ngbiyanju lati lo awọn awoṣe kaakiri lati ṣe ipilẹṣẹ awọn agbeka, eyiti o jẹ deede ti o dara julọ fun simulating awọn agbeka eniyan, ṣugbọn kii ṣe laisi awọn ailagbara, gẹgẹbi awọn ibeere iṣiro giga ati idiju iṣakoso. Lati dinku awọn ailagbara ti awọn awoṣe itọka, MDM nlo nẹtiwọọki ti nẹtiwọọki iyipada ati asọtẹlẹ apẹẹrẹ dipo asọtẹlẹ ariwo ni ipele kọọkan, ti o jẹ ki o rọrun lati ṣe idiwọ awọn aiṣedeede bii isonu ti olubasọrọ oju-aye pẹlu ẹsẹ.

Lati ṣakoso iran, o ṣee ṣe lati lo apejuwe ọrọ ti iṣe ni ede adayeba (fun apẹẹrẹ, “eniyan rin siwaju ati tẹriba lati gbe nkan lati ilẹ”) tabi lo awọn iṣe deede bii “nṣiṣẹ” ati “ n fo.” Eto naa tun le ṣee lo lati ṣatunkọ awọn agbeka ati fọwọsi awọn alaye ti o sọnu. Awọn oniwadi ṣe idanwo kan ninu eyiti a beere lọwọ awọn olukopa lati yan abajade to dara julọ lati awọn aṣayan pupọ - ni 42% ti awọn ọran, awọn eniyan fẹran awọn agbeka ti iṣelọpọ ju awọn ti gidi lọ.



orisun: opennet.ru

Fi ọrọìwòye kun