
3D CNN PyTorch 视频分类工具 - 源码,基于 3D ResNet。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该项目利用3D ResNet模型进行视频分类,并基于PyTorch框架进行了实现。具体而言,3D ResNet模型经过在Kinetics数据集上的训练,该数据集包含了400个不同的动作类别。此代码接收视频作为输入,并在得分模式下,能够输出每16帧的类别名称以及对应的预测类别得分。此外,在功能模式下,该代码每16帧会生成512个暗角特征图(在全局平均池化层之后)。为了方便使用,提供了该代码的Torch(Lua)版本。请确保已通过conda安装pytorch、torchvision和cuda80 -c soumith,同时通过wget从http://johnvansickle.com/ffmpeg/下载FFmpeg和FFprobe。
全部评论 (0)
还没有任何评论哟~


