
MMAL-Net: 细粒度视觉分类中多分支与多尺度注意力学习的PyTorch实现(张凡,李萌,...)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
MMAL-Net是一个利用多分支和多尺度注意力机制提升细粒度视觉分类准确性的PyTorch框架,由张凡、李萌等人开发。
MMAL网是用于细粒度的PyTorch实施(张帆,李萌,翟桂生,刘亦钊)的一篇论文,在第27届国际多媒体建模国际会议(MMM2021)上发表。欢迎就相关问题与我们讨论。
所需环境如下:
- Python 3.7
- Pytorch 1.3.1
- Numpy 1.17.3
- Scikit-image 0.16.2
- Tensorboard 1.15.0
- TensorboardX 2.0
- tqdm 4.41.1
- imageio 2.6.1
- pillow 6.1.0
数据集:
下载CUB 200-2011和FGVC_Aircraft数据集,并将提取的图像文件夹的内容分别复制到以下目录中:
- datasets/CUB_200-2011/images
- datasets/FGVC_Aircraft/data/images
您也可以尝试其他细粒度的数据集。
训练MMAL-Net:如果要训练该网络,请运行相关py脚本。
全部评论 (0)
还没有任何评论哟~


