
Yolov4-Triton-Tensorrt: 在Triton Inference服务器上用TensorRT优化部署YOLOv4模型
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了如何在NVIDIA Triton推理服务器中利用TensorRT技术对YOLOv4模型进行高效优化和部署,实现高性能的实时目标检测服务。
使用TensorRT的Triton Inference Server上的YOLOv4展示了如何将YOLOv4作为优化引擎部署到该服务器上。Triton Inference Server具有许多现成的优势,可用于模型部署,例如GRPC和HTTP接口,在多个GPU上自动调度,共享内存(甚至在GPU上),运行状况度量和内存资源管理。TensorRT通过融合层并为我们的特定硬件选择最快的层实现来自动优化模型的吞吐量和延迟。我们将使用TensorRT API从头开始生成网络,并将所有不支持的图层添加为插件。
构建TensorRT引擎除了需要一个具有GPU支持的docker环境外,不需要其他依赖项。我们将在TensorRT NGC容器内运行所有的编译工作以避免必须本地安装TensorRT。要获取带有我们的回购代码的可运行TensorRT容器,请执行以下命令:
```
cd yourwork
```
全部评论 (0)
还没有任何评论哟~


