
PSP_CVPR_2021: 源码,对应于CVPR-2021论文的PyTorch实现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
CVPR-2021论文的PyTorch实现:本文针对沿视听事件线的正样本传播进行了研究。该研究的核心在于识别包含视听事件的视频片段,并对这些片段进行类别划分。 视听事件指的是同时存在视觉和听觉信息的场景,即声源必须在视觉图像(可见)中呈现,同时发出的声音也存在于音频部分(可听)。为了实现这一目标,我们构建了一个框架,该框架能够准备AVE数据集,并提取音频和视频特征。这些数据集和功能均可从存储库中下载获取。此外,存储库中还包含了其他用于预处理的文件,同样可以从这里下载。 以下表格详细列出了所有必需的数据文件,建议将这些文件放置在data文件夹中。具体来说,包含音频特征的`audio_feature.h5`、视觉特征的`visual_feature.h5`、添加噪声后的音频特征`audio_feature_noisy.h5`以及添加噪声后的视觉特征`visual_feature_noisy.h5`;此外还有右标签文件`right_label.h5`、概率标签文件`prob_label.h5`、噪声标签文件`labels_noisy.h5`、军事标签文件 `mil_labels.h5` 以及训练顺序文件 `train_order.h5` 和验证数据文件 `val`。
全部评论 (0)
还没有任何评论哟~


