
视频图文Matlab代码-Multimodal-Domain-Adaptation: 自然纪录片中的野生动物识别及字幕与外部数据处理...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目通过MATLAB实现多模态领域自适应技术,旨在自然纪录片中自动识别和生成野生动物的字幕。结合内部视频图文信息与外部数据源进行有效融合处理,提升模型跨域泛化能力。
视频图MATLAB代码多峰域适应是一种用于多标签分类的弱监督框架,在多模式上下文中进行领域适应。在缺乏可视分界器的情况下,此框架可用于对带有字幕的目标视频中的对象(如动物)进行注释。我们从训练过的外部数据集(源端设置为ImageNet的数据集)上的分类器开始,并使用文本提示迭代地将其调整为目标数据集。
这是最新的多模式领域适应框架的描述:
Venkitasubramanian,AN,Tuytelaars,T.和Moens,M.-F.在自然纪录片中对野生生物的识别,在字幕和外部数据监督不足的情况下。该论文发表于Elsevier81(2016),第63-70页。
程序许可:此程序是免费软件:您可根据自由软件基金会发布的GNU通用公共许可证条款进行再分发和/或修改,版本为3或者更高版本。分发本程序时希望其有用但不做任何保证;甚至没有对适销性或特定用途适用性的暗示担保。详情请参阅GNU通用公共许可证。
数据集设置:所使用的是BBC的DVD数据集。
全部评论 (0)
还没有任何评论哟~


