
LSTM与VGG16模型用于图像描述的自动生成,适用于学习。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
1. 本数据集使用了flickr8k数据集(包含图像及其对应的文本描述),并借助keras框架构建了一个基于VGG16网络结构的卷积神经网络(CNN)。具体而言,我们利用VGG16网络(移除其最后一层)进行图像特征的提取,将flickr8k数据集中的图像文件转换成相应的图像特征向量,并将这些特征向量保存至pickle文件中。2. 由于数据量较大,详细代码请参阅。该项目是对Jason Brownlee所著《How to Automatically Generate Textual Descriptions for Photographs with Deep Learning》一文中提供的代码的精确复现,并使用了Pycharm开发环境、keras框架、Python 3.6版本、numpy库以及opencv3.3.1等技术工具。
全部评论 (0)
还没有任何评论哟~


