
VIP: PyTorch中的视频平台,适用于动作识别与目标检测
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
VIP是专为PyTorch设计的数据处理平台,专注于视频数据,广泛应用于动作识别和目标检测领域,助力研究者高效开发相关模型。
这是一个用于快速轻松开发深度学习网络的平台,在视频识别与检测方面具有优势,并包括了如C3D及SSD这样的流行模型。
实施模型及其性能如下:
- 识别模型:
架构:I3D;数据集:HMDB51(拆分1);准确度:72.75%
架构:C3D;数据集:HMDB51(拆分1);准确度:50.14±0.777
架构:C3D;数据集:UCF101(拆分1);准确度:80.40±0.399
- 物体检测模型:
架构:SSD 300;数据集:VOC2007;准确度:76.58%
- 视频对象接地模型:
架构:DVSA(+逐帧加权,物体交互);数据集:YC2-BB(验证);准确度:30.09
使用此平台的任何作品时,请引用ViP。
全部评论 (0)
还没有任何评论哟~


