
Toward Resilient Vision Transformers
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文探讨了构建鲁棒视觉Transformer模型的方法,通过增强其在各种扰动和噪声下的表现能力,以提高图像识别任务中的稳定性和准确性。
“Towards Robust Vision Transformer” 论文的学习笔记
ViT模型存在的问题:
在学习“Towards Robust Vision Transformer”这篇论文的过程中,我总结了Vision Transformer (ViT) 模型存在的一些关键问题。
RVT模型与RVT*模型设计规则:
为了改进这些问题,“Robust Vision Transformer”(简称 RVT)及其变体 RVT* 被提出。这些新的架构旨在增强 ViT 的鲁棒性和性能,通过对现有模型结构的调整和优化来实现这一目标。
CAM与Grad-CAM:
论文中还讨论了类激活映射 (Class Activation Mapping, CAM) 和梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)在视觉变换器中的应用。这些技术有助于解释模型决策过程,并提高其透明性和可理解性。
全部评论 (0)
还没有任何评论哟~


