TensorRT推理引擎基础介绍

发表于2021-12-20|更新于2021-12-05

|字数总计:195|阅读时长:1分钟|阅读量:|评论数:

[TOC]

文章参考：https://arleyzhang.github.io/articles/7f4b25ce/

文章参考：https://zhuanlan.zhihu.com/p/35657027

概述

TensorRT是一个高性能的深度学习推理（Inference）优化器，可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持TensorFlow、Caffe、Mxnet、Pytorch等几乎所有的深度学习框架，将TensorRT和NVIDIA的GPU结合起来，能在几乎所有的框架中进行快速和高效的部署推理。

TensorRT 是一个C++库，从 TensorRT 3 开始提供C++ API和Python API，主要用来针对 NVIDIA GPU进行高性能推理（Inference）加速。现在最新版TensorRT是4.0版本。

代码示例

文章作者: Frewen.Wang

文章链接: http://www.frewen.wang/2021/12/20/01.AuraTechNotes/20.AILearning/20.TensorRT%E6%8E%A8%E7%90%86%E5%BC%95%E6%93%8E%E5%AD%A6%E4%B9%A0/01.TensorRT%E6%8E%A8%E7%90%86%E5%BC%95%E6%93%8E%E5%9F%BA%E7%A1%80%E4%BB%8B%E7%BB%8D/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自麦溪·在路上！

神经网络深度学习 TensorRT

赞助

微信打赏
支付宝打赏

相关推荐

ARM平台上的NEON加速基础

ARM平台上的NEON加速基础

ARM平台NEON instrinsics指令学习

ARM平台上使用NEON加速完成3X3 max pool实现

ARM平台上的图像格式转换的NEON加速函数实现

ARM平台上NEON加速常用的函数

评论

ValineDisqus