
vit-insight: 视觉变压器的理解与解释
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Vit-Insight是一篇关于视觉Transformer模型理解与解释的研究文章,深入探讨了该类模型的工作机制及其在计算机视觉任务中的应用潜力。
该存储库实现了视觉变形金刚中的可解释性方法。其中包括:
- 注意卷展栏。
- 梯度注意卷展栏,用于特定类别的解释。
这是我们在“注意”卷展上的进一步尝试,目前尚在进行中的TBD注意流程中包括一些调整和技巧以使其正常工作:
不同的注意头融合方法以及消除最低的关注。使用代码从vit_grad_rollout导入VITAttentionGradRollout,并加载模型如下:
```python
model = torch.hub.load(facebookresearch/deit:main, deit_tiny_patch16_224, pretrained=True)
grad_rollout = VITAttentionGradRollout(model, discard_ratio=0)
```
这段文字已经按照要求进行了重写,去除了链接和其他联系方式。
全部评论 (0)
还没有任何评论哟~


