
卷积神经网络在深度学习中的系统设计与硬件实现
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了卷积神经网络(CNN)在深度学习领域的应用,并分析其系统设计及硬件实现的方法和挑战。
为解决目前深度学习中的卷积神经网络(CNN)在CPU平台下训练速度慢、耗时长的问题,我们采用现场可编程门阵列(FPGA)硬件平台设计并实现了一种深度卷积神经网络系统。该系统使用修正线性单元(ReLU)作为特征输出的激活函数,并利用Softmax函数进行分类。通过运用流水线技术和对每一层的特征运算进行并行处理,实现了在单个时钟周期内完成整个CNN中的295次卷积运算的目标。实验中我们采用MNIST数据集作为样本,在50 MHz的工作频率下,FPGA训练速度比通用CPU提升了8.7倍,并且经过2 000次迭代后系统的识别准确率为92.42%。
全部评论 (0)
还没有任何评论哟~


