
基于深度模型迁移的细粒度图像分类方法.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文提出了一种基于深度模型迁移学习的细粒度图像分类方法,有效提升了相似类别间的识别准确率,为计算机视觉领域提供了新的研究思路。
针对细粒度图像分类方法中存在的模型复杂度过高、难以使用较深的网络架构等问题,本段落提出了一种深度模型迁移(DMT)的方法来解决这些问题。该方法首先在粗粒度数据集上进行预训练;然后,在细粒度的数据集上对这个预训练过的模型的应用层采用不确切监督学习的方式,使得特征分布能够向新的数据集中更加接近的特征方向转变;最后将经过迁移后的模型导出,并应用于相应的测试集合中。实验结果显示,在STANFORD DOGS、CUB-200-2011和OXFORD FLOWER-102这三类细粒度图像的数据集上,DMT方法的分类准确率分别达到了72.23%、73.33%及96.27%,验证了该迁移学习策略在FGIC(Fine-grained Image Classification)任务中的有效性。
传统的细粒度图像分类技术通常需要人工标注局部特征来进行强监督训练,因此这种方法对人力的依赖程度较高。近年来,在仅需类别标签而不需要详细位置信息的情况下进行不确切监督的学习方法成为了研究的新热点。这种学习方式属于弱监督范畴,其特点是利用粗略的类标签而非精确的位置或区域标签来指导模型训练过程。
细粒度图像分类任务中的每一类通常都是某个较宽泛类别下的一个子集;与其它更广泛定义的类别相比,这些细小的区别使得它们之间的区分更加困难。因此,为了有效地区分这类图象,往往需要依赖于稀疏且局部的关键特征信息来进行准确识别。
根据上述分析,在图像分类过程中,FGIC模型可以被看作是由“特征提取器”和“分类器”两部分组成的结构。其中,“特征提取器”的设计与选择是至关重要的环节。目前的细粒度图像特征提取方法大致可分为两类:1)手工构建底层特性;2)利用深度学习算法自动获取高级抽象特性。
对于第一类,Iscen等人曾使用Zernike滤波器进行密集局部块检测,并基于此提出了Zemike SCC的方法来实现特征抽取与分类。而另一研究团队则借鉴了人类视觉系统的分层注意力机制,开发了一种名为HGM的模型用于细粒度图像识别。
对于第二类方法,则更依赖于深度神经网络的能力来进行自动化的特征学习和提取工作。例如Xie等人通过结合在线最近邻估计和支持向量机的方法来分类由深层架构所抽取到的特性;Azizpour团队则尝试微调现有的深度模型以适应细粒度图像分类任务的需求;Qian等提出了一种多阶段度量学习策略,旨在降低大规模特征空间中的计算复杂性。此外还有其他研究如基于贝叶斯证据框架选择最优网络架构进行迁移学习的方案以及自动定位判别区域的Polygon-Based Classifier方法等等。
这些不同的技术路线展示了从手工设计到自动化深度模型的各种尝试,并为未来的研究提供了丰富的思路与方向。
全部评论 (0)


