【讲座通知】如何构建高效的深度学习开发环境

NDIDIA

英伟达

英伟达开发者社区：GPU应用开发启蒙园地

侯宇涛

GPU市场应用总监

深度学习

Nvidia SDK& Tool
开发者社区
DIGITS

应用：

各种游戏方面的
Deep Learning
VR
Design & Visualization

developer.nvidia.com

社区

nvidia中国

nvidia developer china

DIGITS：

数据集处理
深度神经网络配置
过程监控
可视化结果

NVIDIA 开发者社区经理

何琨

Development + Deployment

Training：训练

Desktop
Cloud
Data Center

Inference：推理

Data Center
Self-Driving Cars
Intelligent Machines

Computer Networks

Libraries

cuBLAS
cuSPASE
cuRAND
NPP
cuSOLVER
NCCL
cuFFT
nvGRAPH

Directives

PGI
OpenACC

Deep Learning

cuDNN
TensorRT
NVIDIA Digits
DeepStream SDK

Language Integrations

C
C++
Python
Fortran

Nvidia GPU：

GeForce
Tesla
Tegra？
。。。

一般配置Configuration：

硬件：

CPU：Xeon
Memory：32-64GB
Disk： > 1TB
GPU：Compute Capability > 3.5
GPU:

Tesla K40/K60/K80
Tesla M40/M60
Tesla P4/P40
Tesla V100
Geforce 1060/1070/1080/1080TI
TITAN/TitanV
Tegra K1/X1/X2/Xavier

可以跑完整的Ubuntu等系统

软件：

System: Ubuntu, Redhat, Fedora, OpenSUSE, RHEL, CentOS
GPU Driver
CUDA 9.0

几乎所有的Nvidia的其他工具都是基于CUDA的
很多其他工具，比如OpenCV也是要求CUDA（去利用GPU的？）

CUDNN, CUBLAS, Tensorflow, cuSparse, cuFFT, DeepStream, Nvidia, DIGITS
Caffe Caffe2 TensorFlow, PyTorch MXNet, Matlab, Chainer,…

根据你的需求决定：具体需要什么级别的CPU，内存，GPU等

很多都是矩阵操作，比如相乘

GPU应用领域：

Telas：Data Center
GeForce：Desktop

内核个数：

CPU：常见比如4，8，12等
GPU：常见比如512个

A Complete DL Platform

Manage

给定样本

Train

用Digits -》 Caffe，Torch等框架去训练

Deploy

GPU Inference Engine

开发环境：资源一般很丰富
部署环境：资源往往很有限

受限于尺寸，功耗等等，计算能力有限，其他资源有限

Nvidia Deep Learning SDK and CUDA

Caffe
Caffe2
Chainer
Cognitive Toolkit
Matlab
PaddlePaddle
。。。

各种

cuDNN
TensorRT

推理，小阶段产品

DeepStream SDK （2.0）

（音视频流）编解码期间，即可识别出你要的对象

cuBLAS
cuSPARSE
NCCL

都是基于CUDA

最新CUDA 9.2

Nvidia DIGITS

Interactive Deep Learning GPU Training System

直接用：

浏览器，去操作，远程深度学习的服务器的服务

包括各种管理和监控

还支持自定义

TensorRT：Work Flow

一般是处理4维的数据

比如：ncwh

n=number：多少张图片
c=channel：信道？
w=width：宽
h=height：高

支持：直接做推理

可以不用TensorFlow，Caffe等

比如：

识别图片，至少需要做

praser：解析器
builder：引擎=可执行程序

https://developer.nvidia.com/tensorrt

输入：训练好的模型
输出：engine，可执行程序

演示：

(阿里云服务器，安装好了DIGITS）

tensorrt.cn:5000

问：此系统用于训练非图片，比如信号存到excel，是否支持？

答：要自己normalize后，变成图片这种才能支持。

问：生成对抗网络GAN是否支持？

答：支持。

问：PC机上的程序，如何移植到TS库上？

答：训练模型和网络参数，如果都设置好了，就可以了？

NVIDIA Tesla专业计算卡优势

陈晓翰？吉浦迅 CEO？

之前：4个月
TensorRT：1个月
DeepStream：半天

Tesla专业计算卡：

简称：TS卡

TS1，TS2

特点

一般人：贵
专业：

专业元器件
性能更好
单精度
双精度

ECC：准确度，持久度

下面介绍贵在什么地方：

GPU显卡本身性能：通常以单精度为基准

高性能计算：双精度
深度学习：半精度

显存数量+带宽+传输模式：

单GPU计算：CPU《-》GPU
多GPU计算（包括集群）：GPU《-》GPU
DMA引擎数量、支持GPU Direct技术、Hyper-Q

计算模型限制

GeForce系列：

ECC校验：不支持

Tesla系列：（含TitanV）

ECC校验：支持

确保数据正确与执行稳定

CUDA C Programming Guide

Programming Guide :: CUDA Toolkit Documentation

developer.nvidia-china.com

论坛 – NVIDIA 官方 Developer 论坛 – Powered by Discuz!

首页 – NVIDIA 官方 Developer 论坛 – Powered by Discuz!

机器学习 – GPU 加速的应用 |NVIDIA

Deep Learning Technology|NVIDIA

吉浦迅科技: GPU推广，Nvidia的合作伙伴

问题：

（1）NLP中如何实现深度学习实现从现有的普通的英文对话中学习，具有一定智能，实现自由对话？

吉浦迅科技

微信公众号：gpusolution

功能介绍：在这里，你可以及时了解NVIDIA GPU的行业资讯、最新进展、应用场景和各项功能。参与GPU世界举办的精彩活动，体验人工智能的未来生活。

【讲座通知】如何构建高效的深度学习开发环境

https://mp.weixin.qq.com/s/K3kJRGyY8vBH5H_qH4I1tw

深度学习已确认为进入AI殿堂的入口，对于要创建深度学习系统的企业和科研单位来说，如何快速入门、如何从GPU中获得最大计算收益等成为了他们考虑的因素。

NVIDIA作为人工智能领域技术领导厂商，诚挚邀请您参与6月26日于苏州工业园区西交利物浦大学的技术交流会，由NVIDIA中国区开发者社区经理等人，详细讲解企业或科研单位如何构建AI开发系统、如何搭建NVIDIA深度学习开发环境（TensorRT、cuDNN、DIGITS、CUDA等），以最大限度地提高数据科研人员的工作效率，除此之外，还将面对面交流实际应用时的经验分享。

日期：2018年6月26日

时间：下午13:30~16:30

地点：西交利物浦大学（江苏省苏州市工业园区仁爱路111号）北校区中心楼1106室

议程：

13:30 ~ 13:50报到

14:00 ~ 14:15 NVIDIA GPU应用市场总监侯宇涛

14:15 ~ 15:20 NVIDIA 开发者社区经理何琨

15:20 ~ 15:30 休息时间

15:30 ~ 15:50 经验分享-NVIDIA Tesla专业计算卡优势

15:50 ~ 16:30QA时间

转载请注明：在路上 » 【讲座通知】如何构建高效的深度学习开发环境

Post Views: 732

【讲座通知】如何构建高效的深度学习开发环境

与本文相关的文章

Hi，您需要填写昵称和邮箱！