ተጨባጭ የሰዎች እንቅስቃሴዎችን ለመፍጠር የማሽን መማሪያ ስርዓት ኮድ ተከፍቷል።

ከቴል አቪቭ ዩኒቨርሲቲ የተመራማሪዎች ቡድን ከኤምዲኤም (Motion Diffusion Model) የማሽን መማሪያ ሥርዓት ጋር የተያያዘውን የምንጭ ኮድ ከፍቷል፣ ይህም ተጨባጭ የሰዎች እንቅስቃሴዎችን መፍጠር ያስችላል። ኮዱ የፒቶርች ማዕቀፍን በመጠቀም በፓይዘን የተፃፈ ሲሆን በ MIT ፍቃድ ይሰራጫል። ሙከራዎችን ለማካሄድ ሁለቱንም የተዘጋጁ ሞዴሎችን መጠቀም እና የታቀዱትን ስክሪፕቶች በመጠቀም ሞዴሎቹን እራስዎ ማሰልጠን ይችላሉ ለምሳሌ የ HumanML3D የሶስት አቅጣጫዊ የሰዎች ምስሎች ስብስብ በመጠቀም። ስርዓቱን ለማሰልጠን የCUDA ድጋፍ ያለው ጂፒዩ ያስፈልጋል።

የሰውን እንቅስቃሴ ለማንቃት ባሕላዊ ችሎታዎችን መጠቀም ከትልቅ የተለያዩ ሊሆኑ የሚችሉ እንቅስቃሴዎች ጋር በተያያዙ ውስብስቦች እና በመደበኛነት የመግለጽ ችግር እንዲሁም የሰው ልጅ ተፈጥሮአዊ ላልሆኑ እንቅስቃሴዎች ያለው ግንዛቤ ከፍተኛ ነው። ከዚህ ቀደም የጄኔሬቲቭ ማሽን መማሪያ ሞዴሎችን ለመጠቀም የተደረጉ ሙከራዎች የጥራት እና ውስን የመግለፅ ችግሮች ነበሩባቸው።

የታቀደው ስርዓት እንቅስቃሴን ለማመንጨት የስርጭት ሞዴሎችን ለመጠቀም ይሞክራል፣ እነዚህም በተፈጥሯቸው የሰውን እንቅስቃሴ ለማስመሰል የተሻሉ ናቸው፣ ነገር ግን እንደ ከፍተኛ ስሌት መስፈርቶች እና የቁጥጥር ውስብስብነት ያሉ እንቅፋቶች አይደሉም። የስርጭት ሞዴሎችን ድክመቶች ለመቀነስ ኤምዲኤም በየደረጃው ከድምጽ ትንበያ ይልቅ የትራንስፎርመር ነርቭ ኔትወርክን እና የናሙና ትንበያን ይጠቀማል፣ ይህም ከእግር ጋር የገጽታ ንክኪ እንዳይፈጠር ለመከላከል ቀላል ያደርገዋል።

ትውልድን ለመቆጣጠር በተፈጥሮ ቋንቋ (ለምሳሌ "አንድ ሰው ወደ ፊት ሄዶ አንድ ነገር ከመሬት ላይ ለማንሳት ጎንበስ ብሎ") የጽሁፍ መግለጫን መጠቀም ወይም እንደ "መሮጥ" እና " የመሳሰሉ መደበኛ ድርጊቶችን መጠቀም ይቻላል. መዝለል” ስርዓቱ እንቅስቃሴዎችን ለማረም እና የጠፉ ዝርዝሮችን ለመሙላት ጥቅም ላይ ሊውል ይችላል። ተመራማሪዎቹ ተሳታፊዎቹ ከበርካታ አማራጮች የተሻለ ውጤት እንዲመርጡ የተጠየቁበት ሙከራ አደረጉ - በ 42% ከሚሆኑት ጉዳዮች ውስጥ ሰዎች ከእውነተኛው ይልቅ የተቀናጁ እንቅስቃሴዎችን ይመርጣሉ።



ምንጭ: opennet.ru

አስተያየት ያክሉ