
《用于视觉问答的深层模块化协同注意力网络》
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文提出了一种新的深层模块化协同注意力网络模型,专门针对视觉问答任务设计,有效提升了机器理解和回答基于图像的问题的能力。
近年来,协同注意力机制在视觉问答(VQA)领域得到了广泛应用。然而,传统的协同注意力方法通常先计算各模态的注意力分布信息,再建立不同模态间的相关性,从而忽略了模态内部的相关性问题。本论文基于Self-Attention机制,并结合Transformer架构设计了MCA模块,在此基础上构建了一个深层模块化网络MCAN。
2.1 MCASelf-Attention (SA) 用于挖掘各模块内的关系,而Guided-Attention (GA) 则用于探索不同模块之间的关联性。该模型的设计遵循了Transformer中的scaled dot-product attention机制。
全部评论 (0)
还没有任何评论哟~


