用于生成真实人体动作的机器学习系统的代码已经开放

特拉维夫大学的一组研究人员开放了与 MDM(运动扩散模型)机器学习系统相关的源代码,该系统可以生成逼真的人体运动。 该代码是使用 PyTorch 框架用 Python 编写的,并根据 MIT 许可证分发。 要进行实验,您可以使用现成的模型,并使用建议的脚本自行训练模型,例如,使用三维人体图像的 HumanML3D 集合。 为了训练系统,需要支持 CUDA 的 GPU。

由于与多种可能的运动相关的复杂性和正式描述它们的难度,以及人类感知对非自然运动的高度敏感性,使用传统能力来动画人类运动是困难的。 之前使用生成机器学习模型的尝试存在质量问题和表达能力有限。

所提出的系统尝试使用扩散模型来生成运动,这种模型本质上更适合模拟人体运动,但也有缺点,例如高计算要求和控制复杂性。 为了最大限度地减少扩散模型的缺点,MDM 在每个阶段都使用变压器神经网络和样本预测来代替噪声预测,从而更容易防止诸如脚部表面接触丢失等异常情况。

为了控制生成,可以使用自然语言对动作的文本描述(例如,“一个人向前走,弯腰从地上捡起东西”)或使用标准动作,例如“跑步”和“跳。” 该系统还可用于编辑动作并填充丢失的细节。 研究人员进行了一项测试,要求参与者从多个选项中选择一个更好的结果——在 42% 的情况下,人们更喜欢合成动作而不是真实动作。



来源: opennet.ru

添加评论