
基于Swin-Transformer的图像分类项目实践:利用30种水果数据集进行迁移学习
5星
- 浏览量: 0
- 大小:None
- 文件类型:7Z
简介:
本项目运用Swin-Transformer模型,在包含30种水果的数据集上实施迁移学习,专注于提升图像分类精度与效率。
本项目基于Swin-Transformer网络进行迁移学习,在一个包含30种水果图像分类的数据集上进行了训练(包括芒果、葡萄、苦瓜、荔枝)。该项目提供了完整的代码、数据集以及经过10个epoch训练后的权重文件,可以直接运行。
【网络】使用了参数量为8千万左右的Swin-Transformer。
【数据集】包含30种水果图像分类的数据集。
【训练(train.py)】
1. 在训练过程中对数据进行随机裁剪、翻转等增强操作。
2. 网络初始化时自动加载在ImageNet上的预训练权重,以实现迁移学习的效果。
3. 训练脚本会自动生成包含类别信息的json文件,并根据该文件设置网络输出维度。完成训练后,会在run_results目录下生成包括训练集loss曲线、学习率衰减曲线和测试集准确度曲线在内的多种结果图表以及详细的训练日志。
【预测(predict.py)】只需将待预测图像放置在inference文件夹内,代码会自动对这些图片进行分类,并在每张图的左上角标注出前三类及其概率值。无需做任何额外配置或修改代码即可实现这一功能。
经过10个epoch训练后,模型准确率达到98.52%。增加更多的训练轮次可以进一步提高网络精度。
全部评论 (0)
还没有任何评论哟~


