当前位置:首页>>行业资讯>>市场分析>> Nvidia发表超大规模推论平台,瞄准大规模AI推论应用需求

Nvidia发表超大规模推论平台,瞄准大规模AI推论应用需求

时间:2018-09-17  来源:华强电子网  浏览次数:1220

  Nvidia推出用于语音、影片、图片以及推荐服务的Tensorrt超大规模推论平台(Tensorrt Hyperscale Inference Platform),其使用的Tesla GPU提供高速处理深度学习工作负载的能力,而推论优化引擎TensorRT则可以充分利用Tesla GPU的效能,处理影片串流、语音和推荐系统等应用,并为Nvidia DeepStream SDK提供运算基础。

  Nvidia提到,现在大规模数据中心可以借助超大规模推论平台的能力,使用增强的自然语言互动,并直接获取查询的答案,而非只是一些预存的可能候选答案。

  超大规模推论平台由三个主要部分组成,Tesla T4 GPU、TensorRT 5以及TensorRT推论服务器。 Tesla T4 GPU拥有320个Turing Tensor Cores以及2,560个CUDA核心,提供灵活的FP32、FP16、INT8和INT4的多精度运算,其推测速度是相同耗能CPU的40倍。

  而TensorRT 5则是推论优化程序和Runtime引擎,TensorRT 5支持Turing Tensor Core,针对多精度工作负载扩展了神经网络优化,能低延迟提供推荐系统、语音识别和机器翻译等高吞吐量的应用服务, 并且TensorRT还能将使用32或是16位数据训练的模型,为Tesla T4和P4上优化成INT8操作,以及在Tesla V100上优化为FP16。 同时还赋予DeepStream SDK利用Tesla GPU,同时译码和分析影片串流。

  TensorRT推论服务器是容器化的微服务软件,可以在数据中心环境让应用程序使用人工智能模型。 TensorRT推测服务器是一个可以立即执行的容器,其提供的微服务可以让用户透过API,在一个或是多个GPU上,使用Caffe2、TensorRT和TensorFlow等任何支持ONNX标准的框架进行推测。

相关资讯
资讯推荐
热门新闻排行
  1. 益昂通信推出第二代 ChronoPHY™万兆PHY芯片功耗降低40% 赋能AI边缘网络基础设施
  2. 方案拆解 | Edge AI算力重构,Synaptics新平台背后的Arm Cortex M52 + Ethos U55
  3. AMD 发布新款第二代 Versal Prime 系列器件:业界领先的标量计算能力,更小的尺寸规格
  4. 陶氏公司亮相COMPUTEX TAIPEI 2026,以创新热管理材料科学助力实现“AI Together”
  5. 村田开始量产小型化、大容量汽车用树脂外部电极片状MLCC
  6. AMD FPGA 助力 ModRetro 以 M64 游戏主机重现复古游戏魅力
  7. 方寸之间,智启无界新生——村田中国将携四大领域创新产品亮相2026慕尼黑上海电子展
  8. 村田开始通过新思科技电磁场及热分析工具提供仿真模型
更多>>视频分享