
利用卷积神经网络进行图像描述生成的方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究提出了一种基于卷积神经网络的图像描述生成方法,通过深度学习技术自动解析并描绘图片内容,为视觉识别领域带来新的突破。
图像描述任务在计算机视觉领域一直备受关注。尽管使用卷积神经网络(CNN)与长短期记忆网络(LSTM)相结合的框架解决了生成图像描述中的梯度消失及爆炸问题,但基于LSTM模型的问题在于其序列化生成过程无法实现训练时的并行处理,并且容易遗忘先前的信息。为了克服这些挑战,本段落引入了条件生成对抗网络(CGAN),通过CNN来提取和利用图像特征。实验中采用对抗性学习方法结合注意力机制以提高描述的质量。
在MSCOCO数据集上的测试结果显示,在语义丰富程度指标CIDER上与基于CNN的方法相比有2%的提升;而在准确性指标BLEU上有1%左右的进步,部分性能甚至超过了传统的LSTM模型图像描述法。这一结果表明该方法生成的图像描述能够更好地接近真实情况,并且在语义内容方面更为丰富和准确。
全部评论 (0)
还没有任何评论哟~


