
GAST-Net在视频中的3D人体姿态估计:基于图注意力时空卷积网络的方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究提出了一种基于图注意力时空卷积网络(GAST-Net)的新方法,用于视频中的人体三维姿态估计。通过结合图神经网络和时空卷积操作,该模型能够有效捕捉复杂的人体运动模式,并在多个基准数据集上取得了卓越的性能表现。
我们更新了GAST-Net模型以生成包括关节与脚部在内的19个关键点的人体姿态,并提供了从自定义视频创建3D姿势/动画的教程。此外,通过单个RGB相机实现了基于在线3D骨架的动作识别功能,并且还成功地进行了实时3D姿态估计。
在处理遮挡和深度模糊的问题时,时空信息显得尤为重要。以往的研究主要集中在时间上下文或局部到全局架构中嵌入固定长度的时间序列的时空信息上。然而,在灵活捕捉变化中的时空序列并实现高效的实时三维姿态估计方面,目前尚未提出有效的解决方案。
在这项工作中,我们通过引入注意机制来对局部和整体空间信息进行建模,并改进了对人体骨骼运动学约束的学习:包括姿势、局部运动连接以及对称性等方面的知识。为了适应单帧与多帧的估算需求,采用了扩张技术以增强模型性能。
全部评论 (0)
还没有任何评论哟~


