Advertisement

ONNX Runtime:跨平台的高性能机器学习推理与训练加速器

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
ONNX Runtime是一款高效的执行工具,专为提升机器学习模型的推理和训练速度设计,支持多种平台无缝运行。 ONNX Runtime 是一个跨平台的推理与训练加速器,并且兼容多种流行的机器学习/深度神经网络框架,如 PyTorch、TensorFlow/Keras 和 scikit-learn 等。 许多用户可以从 ONNX Runtime 中获益,包括那些希望: 1. 提升各种 ML 模型的推断性能; 2. 减少大规模模型训练的时间和成本; 3. 使用 Python 进行培训但可以部署到 C# / C++ / Java 应用程序中; 4. 在不同的硬件及操作系统上运行; 5. 利用多个不同框架创建的支持模型。 自 2019 年 10 月以来,API 已经稳定并投入生产使用,从而实现了更快的客户体验和更低的成本。在预览阶段(2020年5月),引入了支持在多节点 NVIDIA GPU 上加速 PyTorch 训练的功能以针对变压器模型。 关于如何开始使用推断,请参阅文档中的不同版本组合指令说明。 ONNX Runtime 支持基于标准格式的模型,兼容包括但不限于 PyTorch、scikit-learn 和 TensorFlow 等框架和工具。从 ONNX v1.2.1 开始,ONNX Runtime 成为了最新版,并且持续更新以支持更多功能。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • ONNX Runtime
    优质
    ONNX Runtime是一款高效的执行工具,专为提升机器学习模型的推理和训练速度设计,支持多种平台无缝运行。 ONNX Runtime 是一个跨平台的推理与训练加速器,并且兼容多种流行的机器学习/深度神经网络框架,如 PyTorch、TensorFlow/Keras 和 scikit-learn 等。 许多用户可以从 ONNX Runtime 中获益,包括那些希望: 1. 提升各种 ML 模型的推断性能; 2. 减少大规模模型训练的时间和成本; 3. 使用 Python 进行培训但可以部署到 C# / C++ / Java 应用程序中; 4. 在不同的硬件及操作系统上运行; 5. 利用多个不同框架创建的支持模型。 自 2019 年 10 月以来,API 已经稳定并投入生产使用,从而实现了更快的客户体验和更低的成本。在预览阶段(2020年5月),引入了支持在多节点 NVIDIA GPU 上加速 PyTorch 训练的功能以针对变压器模型。 关于如何开始使用推断,请参阅文档中的不同版本组合指令说明。 ONNX Runtime 支持基于标准格式的模型,兼容包括但不限于 PyTorch、scikit-learn 和 TensorFlow 等框架和工具。从 ONNX v1.2.1 开始,ONNX Runtime 成为了最新版,并且持续更新以支持更多功能。
  • TensorRT:一个用于NVIDIA GPU和深度C++库
    优质
    TensorRT是由NVIDIA开发的一款高性能C++库,专为在GPU及深度学习加速器上进行高效的深度学习模型推理而设计。 该存储库包含NVIDIA TensorRT的开源软件(OSS)组件。这些组件包括TensorRT插件和解析器(如Caffe和ONNX),以及演示如何使用TensorRT平台及其功能的应用示例。这些开源软件是TensorRT通用可用性版本中的部分内容,具有额外的功能扩展及错误修复。 对于向TensorRT-OSS代码库贡献的指南,请查阅相关文档。 有关于每个TensorRT-OSS版本新增特性和更新的信息摘要也已提供。 构建 先决条件: 要构建TensorRT-OSS组件,您需要安装以下软件包。首先需确保拥有TensorRT GA(通用可用性)版本v7.2.1。
  • 数据(人工智)
    优质
    机器学习训练依赖大量高质量数据来优化算法模型,使之能够从经验中学习并改进预测或决策能力,在人工智能领域发挥关键作用。 自2015年以来,人工智能逐渐成为热门领域,并在随后的应用落地过程中展现了其重要性之一——智能客服系统的发展。这一趋势由多种因素推动:一方面,传统客户服务行业面临着人力资源投入大、管理难度高以及一线员工可替代性强的问题;另一方面,当前的人工智能技术主要用于辅助人类工作或代替人力执行重复任务。这些情况共同促成了人工智能在客户服务行业的广泛应用,例如智能客服机器人、自动质检系统和外呼系统等解决方案的普及。
  • MLPClassifier_模型_源码_
    优质
    本项目基于Python的scikit-learn库,实现多类概率分类(MLPClassifier)模型的训练与应用。通过详细解读源代码,帮助理解并优化神经网络在复杂数据集上的分类性能。 适合初学者学习的机器模型相关知识涉及一些常用的Python库文件,通过这些内容可以深入理解相关的概念和技术。
  • 利用C++和ONNX Runtime/OpenCV执行ONNX模型(含代码)
    优质
    本文提供了一个使用C++结合ONNX Runtime和OpenCV进行ONNX模型推理的实用教程及完整代码示例,帮助开发者轻松实现模型部署。 使用C++结合onnxruntime和opencv库对ONNX模型进行推理(附代码)。
  • SimplifyML:基于Django
    优质
    SimplifyML是一款基于Django框架开发的用户友好型机器学习平台,旨在简化复杂的数据模型构建过程,使非专业背景的技术人员也能轻松上手。 简树是一个使用Django搭建的在线可视化机器学习平台。
  • 用C++和ONNX Runtime将PyTorch模型转换为ONNX并进行
    优质
    本教程详细介绍如何使用C++和ONNX Runtime将训练好的PyTorch模型导出为ONNX格式,并在C++环境中进行高效的推理操作。 使用PyTorch将模型转换为ONNX格式,并通过C++的onnxruntime进行推理加载。
  • 重新人手臂:搭建环境初始强化
    优质
    本项目旨在通过构建模拟环境和采用强化学习方法来训练机器人手臂完成复杂任务。着重于算法优化及实际应用测试。 从头开始训练机器人手臂:建立培训框架;学习如何从零构建环境;完成基本的环境脚本,观察机器臂的动作表现;插入强化学习方法并尝试进行训练;优化与调试过程;设定目标及依存关系。整个练习使用张量流(TensorFlow)和麻木库来实现代码功能。有关此强化学习练习的具体中文教程可以继续查阅相关文档或资源以获取更多信息。
  • 京东电商荐系统应用实践
    优质
    本文介绍了在京东电商平台中,通过运用先进的机器学习技术优化推荐系统的方法和实际案例,旨在提升用户体验和平台效益。 基于用户和物品的推荐系统在机器学习行业中值得深入分析。
  • yolov5在华为昇腾Atlas
    优质
    本文介绍了YOLOv5模型在华为昇腾Atlas平台上的优化与部署过程,详细阐述了如何实现高性能、低延迟的目标检测应用。 该资源为在华为昇腾Atlas设备上使用Ascend310芯片加速YOLOv5推理的C++后端开发示例。适用于希望在华为昇腾盒子上移植深度学习算法的C++开发者。 此资源包含完整代码、转好的离线模型文件以及测试结果图片。