
基于脉动阵列的卷积运算硬件模块设计
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究设计了一种高效的脉动阵列架构硬件模块,专门用于加速卷积运算,适用于深度学习领域,显著提升了计算效率和性能。
在FPGA实现卷积神经网络的过程中,高并行度带来了长广播与多扇入/扇出的数据通路问题。为解决这一挑战,采用脉动阵列来执行卷积计算模块的构建,并将权重固定于每个处理单元中。根据输入和输出特征图的维度设定脉动阵列大小后,通过Vivado高层次综合实现卷积计算模块的设计。实验结果表明,在满足一级流水化时序要求的同时,该设计具有较低资源占用量及良好的扩展性。
全部评论 (0)
还没有任何评论哟~


