
小型CNN在FPGA上的加速实现——从深度学习CNN算法的软件到硬件(FPGA)转换的学习项目
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目聚焦于将深度学习中的小型卷积神经网络(CNN)模型移植至现场可编程门阵列(FPGA),进行高效能计算加速的研究与实践,旨在探索软件向硬件转化的技术路径。
通过本工程可以学习深度学习CNN算法从软件到硬件FPGA的部署。网络的软件部分基于TF2实现,并通过Python导出权重参数;硬件部分采用Verilog语言编写,代码完全手动编写且可读性高,支持高度参数化配置,可以根据速度或资源需求调整加速效果。量化后的参数存储在片上RAM中,开发环境使用Vivado工具。
项目包含基础的测试平台(testbench),输入数据存放在RAM内;网络结构采用28*28*1作为输入尺寸,并且卷积层和池化层可以进行配置优化。单张图片推理时间约为50微秒左右。本项目提供所有相关的软件(Python)和硬件(Verilog)代码,方便学习与研究使用。
全部评论 (0)
还没有任何评论哟~


