
基于多并行计算与存储的CNN加速器.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本文档探讨了一种新的卷积神经网络(CNN)加速器设计方法,该方法利用了多并行计算和先进的存储技术,旨在显著提高CNN模型的处理速度和效率。
基于深度卷积神经网络(CNN)的前向推理结构特点设计了一种加速器,该加速器采用了多并行计算与存储技术。从运算效率和数据重用的角度分析了卷积运算的并行特征,并研究了全连接层的全并行流水实现方式。
此加速器通过采用并行流水结构来提高计算效率,在卷积层中充分利用多种卷积运算架构,平衡计算效率与参数及数据载入带宽的需求。同时,该设计还采用了三种加速方法以实现在卷积层内部的完全流水线化处理。对于全连接层中的乘累加操作,则将其设计成一个完整的流水线结构,在不超过20个时钟周期的情况下完成,并通过并行计算实现16倍的速度提升。
全部评论 (0)
还没有任何评论哟~


