Advertisement

TKDNN:适用于NVIDIA Jetson平台的高性能深度神经网络库与工具包

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
简介:TKDNN是专为NVIDIA Jetson设计的一款高效能深度神经网络库及工具包,旨在优化Jetson平台上的AI应用性能。 tkDNN 是一个利用 cuDNN 和 tensorRT 原语构建的深度神经网络库,专门针对 NVIDIA Jetson 开发板设计。该库已经在 TK1(分支 cudnn2)、TX1、TX2、AGX Xavier、Nano 以及多个离散 GPU 上进行了测试。该项目的主要目标是最大限度地利用 NVIDIA 板卡资源,以实现最佳的推理性能。tkDNN 不支持训练功能。 如果您在研究中使用了 tkDNN,请引用相关文献: @inproceedings{verucchi2020systematic, title={A Systematic Assessment of Embedded Neural Networks for Object Detection}, author={Verucchi, Micaela and Brilli, Gianluca and Sapienza, David}

全部评论 (0)

还没有任何评论哟~
客服
客服
  • TKDNNNVIDIA Jetson
    优质
    简介:TKDNN是专为NVIDIA Jetson设计的一款高效能深度神经网络库及工具包,旨在优化Jetson平台上的AI应用性能。 tkDNN 是一个利用 cuDNN 和 tensorRT 原语构建的深度神经网络库,专门针对 NVIDIA Jetson 开发板设计。该库已经在 TK1(分支 cudnn2)、TX1、TX2、AGX Xavier、Nano 以及多个离散 GPU 上进行了测试。该项目的主要目标是最大限度地利用 NVIDIA 板卡资源,以实现最佳的推理性能。tkDNN 不支持训练功能。 如果您在研究中使用了 tkDNN,请引用相关文献: @inproceedings{verucchi2020systematic, title={A Systematic Assessment of Embedded Neural Networks for Object Detection}, author={Verucchi, Micaela and Brilli, Gianluca and Sapienza, David}
  • SchNetPack:原子系统
    优质
    简介:SchNetPack是一款针对原子系统设计的深度学习框架,旨在简化分子与材料科学中基于神经网络模型的研究和应用开发。 SchNetPack旨在为原子系统提供易于使用的深度神经网络模型,这些模型能够直接用于训练与应用,并且支持自定义架构的扩展。当前提供的模型包括: - SchNet:一种端到端连续过滤器CNN,适用于分子和材料。 - wACSF:原子为中心的加权对称函数。 我们将继续努力改进文档、增加更多数据集的支持及提供更多的功能选项。 安装要求: - Python3 - 日月光麻木PyTorch(> = 0.4.1) - h5py 可选依赖项: - tensorboardX 注意:我们建议使用GPU进行神经网络的训练。 可以通过pip命令直接安装SchNetPack: ``` pip install schnetpack ``` 或者从源代码进行安装,步骤如下: 克隆GitHub上的存储库并进入目录 ```shell git clone https://github.com/atomistic-machine-learning/schnetpack.git cd schnetpack ```
  • NVIDIA Jetson和ROS进行学习:将预训练部署至NVIDIA Jetson硬件并...
    优质
    本教程介绍如何在NVIDIA Jetson平台上使用ROS部署预训练的神经网络,实现深度学习应用。适合机器人开发者进阶学习。 这段文字描述了 MATLAB 和 Simulink Robotics Arena 视频“使用 NVIDIA Jetson 和 ROS 进行深度学习”的示例文件的内容。该示例展示了如何将预训练的神经网络从 MATLAB 部署到 Jetson,并在手写的 C++ ROS 节点中利用生成的库。下载相关文件后,请查阅 README 文档以获取关键设置信息。
  • 机器学习模型可视化——学习
    优质
    本工具专为深度学习设计,提供神经网络及机器学习模型的高效可视化服务,助力用户深入理解复杂算法结构和运行机制。 支持ONNX(.onnx,.pb,.pbtxt),Keras(.h5,.keras),Caffe(.caffemodel,.prototxt),Caffe2(predict_net.pb,predict_net.pbtxt),MXNet(.model,-symbol.json)和ncnn(.param)以及TensorFlow模型的可视化。
  • N-BEATS-master.zip_人/学习/_Python__人/学习/_Python_
    优质
    N-BEATS-master 是一个使用Python编写的开源项目,专注于时间序列预测。该项目基于深度学习框架,应用了先进的神经网络架构N-BEATS,以实现高效的时间序列分析和预测能力。 N-BEATS是一种基于神经网络的单变量时间序列预测模型。其实现涉及使用深度学习技术来提高时间序列数据的预测精度。这种方法通过堆叠多个模块进行前向传播,每个模块包含一个逆向残差块和一个全连接层,用于捕捉复杂的时间依赖关系并生成未来值的精确预测。
  • 机器学习、学习、.docx
    优质
    本文档探讨了机器学习的基础概念,并深入解析了深度学习及其核心组件——神经网络和深度神经网络的工作原理和发展现状。 1.1 机器学习算法 随着多年的发展,机器学习领域已经涌现出了多种多样的算法。例如支持向量机(SVM)、K近邻(KNN)、K均值聚类(K-Means)、随机森林、逻辑回归和神经网络等。 从这些例子可以看出,尽管神经网络在当前的机器学习中占据了一席之地,但它仅仅是众多算法之一。除了它之外,还有许多其他重要的技术被广泛使用。 1.2 机器学习分类 根据学习方式的不同,可以将机器学习分为有监督、无监督、半监督和强化学习四大类: - **有监督学习**:这种类型的学习涉及带有标签的数据集,在这些数据集中每个样本都包含特征X以及相应的输出Y。通过这种方式,算法能够从标记好的示例中进行训练,并逐步提高预测准确性。 - **无监督学习**:在这种情况下,提供给模型的是未标注的输入变量集合(即只有X),没有明确的目标或结果标签供参考。目标是让机器找出数据中的内在结构、模式或者群组等信息。 - **半监督学习**:该方法结合了有监督和无监督的特点,在训练过程中既利用带有标签的数据,也使用大量未标记的信息来改进模型性能。 - **强化学习**:这是一种通过试错机制进行的学习方式。在这种框架下,智能体(agent)执行操作并根据环境反馈获得奖励或惩罚作为指导信号,从而学会如何采取行动以最大化长期累积回报。 半监督方法的一个优点是它只需要少量的标注数据就能实现有效的训练,并且避免了完全依赖于无标签信息可能带来的不确定性问题。
  • 优质
    神经网络工具包是一套用于构建和训练人工神经网络的软件库或框架,广泛应用于机器学习、数据挖掘等领域。 Matlab神经网络算法的程序包包含了各种应用。
  • oneDNN:(oneAPIoneDNN)
    优质
    oneDNN是oneAPI工具包的一部分,旨在加速深度学习中的卷积神经网络运算,通过优化数学核心函数提供高性能计算支持。 oneAPI深度神经网络库(简称 oneDNN)是之前名为用于深度神经网络的英特尔数学内核库(Intel MKL-DNN)和深度神经网络库(DNNL)项目的升级版。随着项目的发展,我们将其名称及存储位置与oneAPI其他部分统一,即短名改为oneDNN,并将仓库从intel/mkl-dnn移至一个新地址。 当前链接到代码和文档的现有路径仍然有效。目前,应用程序编程接口、环境变量或计划构建选项均未发生变化。作为开源跨平台性能库,oneDNN为深度学习应用提供了基本构造块的支持。该库优化了英特尔架构处理器、英特尔处理器图形以及基于Xe架构的图形处理能力。 此外,oneDNN还对以下架构提供实验性支持:Arm 64位架构(AArch64)、NVIDIA GPU、OpenPOWER Power ISA(PPC64)和IBMz系统(s390x)。此库专为期望在英特尔CPU及GPU上提升应用性能的深度学习开发者设计。
  • 学习箱:分析利器
    优质
    深度学习工具箱提供强大的功能与模块,助力研究者和工程师构建、训练及评估复杂的深度神经网络模型,是进行机器学习项目开发不可或缺的资源。 深度学习工具箱(开发阶段) 这是一组用于分析和可视化深度神经网络的工具。 该工具箱最初的目的是为了可视化网络以解决图像分类任务。这项工作的动机源于以下论文: Jason Yosinski,Jeff Clune,Anh Nguyen,Thomas Fuchs 和 Hod Lipson 在2015年国际机器学习大会(ICML)的深度学习研讨会上发表的研究成果。 主要设计目标包括但不限于: 模块化:可以在通用核心功能的基础上添加新的工具 框架不可知性:该工具箱应支持不同的神经网络框架,例如TensorFlow、Torch和Caffe等。 清晰的API:定义接口以便在其他程序中使用这些工具 全面的命令行界面(CLI):允许从命令行或脚本运行所有工具 易于使用的图形用户界面(GUI):提供对工具直观的操作方式 这项工作目前仍在进行之中。以下记录了一些已经实现的功能。 功能性: 展示了用于不同形状分类任务的网络可视化示例 主窗口包括选定层的激活情况