
Modular Attention Network in Referring Expression Comprehension...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了一种新颖的模块化注意力网络架构,用于提高图像中基于自然语言描述的目标区域识别准确性,在指称表达理解任务上取得了显著效果。
今天是阅读2018年CVPR论文MAttNet源码的第一天。由于这是第一次读论文的源代码,有很多不懂的地方,在此记录每天的学习进度,希望可以不断提高自身能力。该论文训练的第一个步骤是准备训练数据,因此先从tools/propro.py开始学习。这篇论文可以加载refclef、refcoco、refcoco+和refcocog四种数据集,本段落以refclef为例。
首先,在pyutils/refer/refer.py文件中的REFER类里进行实例化操作:
```python
refer = REFER(data_root, dataset=refclef, splitBy=unc)
```
在REFER类中,会先加载refs(unc).p和i这两个文件。
全部评论 (0)
还没有任何评论哟~


