最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

【讲座通知】如何构建高效的深度学习开发环境

学习 crifan 342浏览 0评论
NDIDIA
英伟达

英伟达开发者社区:GPU应用开发启蒙园地
侯宇涛
GPU市场应用总监
深度学习
  • Nvidia SDK& Tool
  • 开发者社区
  • DIGITS
应用:
  • 各种游戏方面的
  • Deep Learning
  • VR
  • Design & Visualization
developer.nvidia.com
社区
nvidia中国
nvidia developer china
DIGITS:
  • 数据集处理
  • 深度神经网络配置
  • 过程监控
  • 可视化结果

NVIDIA 开发者社区经理
何琨
Development + Deployment
  • Training:训练
    • Desktop
    • Cloud
    • Data Center
  • Inference:推理
    • Data Center
    • Self-Driving Cars
    • Intelligent Machines
Computer Networks
  • Libraries
    • cuBLAS
    • cuSPASE
    • cuRAND
    • NPP
    • cuSOLVER
    • NCCL
    • cuFFT
    • nvGRAPH
  • Directives
    • PGI
    • OpenACC
  • Deep Learning
    • cuDNN
    • TensorRT
    • NVIDIA Digits
    • DeepStream SDK
  • Language Integrations
    • C
    • C++
    • Python
    • Fortran
Nvidia GPU:
  • GeForce
  • Tesla
  • Tegra?
  • 。。。
一般配置Configuration:
  • 硬件:
    • CPU:Xeon
    • Memory:32-64GB
    • Disk: > 1TB
    • GPU:Compute Capability > 3.5
    • GPU:
      • Tesla K40/K60/K80 
      • Tesla M40/M60
      • Tesla P4/P40
      • Tesla V100
      • Geforce 1060/1070/1080/1080TI
      • TITAN/TitanV
      • Tegra K1/X1/X2/Xavier
        • 可以跑完整的Ubuntu等系统
  • 软件:
    • System: Ubuntu, Redhat, Fedora, OpenSUSE, RHEL, CentOS
    • GPU Driver
    • CUDA 9.0
      • 几乎所有的Nvidia的其他工具都是基于CUDA的
      • 很多其他工具,比如OpenCV也是要求CUDA(去利用GPU的?)
    • CUDNN, CUBLAS, Tensorflow, cuSparse, cuFFT, DeepStream, Nvidia, DIGITS
    • Caffe Caffe2 TensorFlow, PyTorch MXNet, Matlab, Chainer,…
根据你的需求决定:具体需要什么级别的CPU,内存,GPU等
很多都是矩阵操作,比如相乘
GPU应用领域:
  • Telas:Data Center
  • GeForce:Desktop
内核个数:
  • CPU:常见比如4,8,12等
  • GPU:常见比如512个
A Complete DL Platform
  • Manage
    • 给定样本
  • Train
    • 用Digits -》 Caffe,Torch等框架去训练
  • Deploy
    • GPU Inference Engine
  • 开发环境:资源一般很丰富
  • 部署环境:资源往往很有限
    • 受限于 尺寸,功耗等等,计算能力有限,其他资源有限
  • Nvidia Deep Learning SDK and CUDA
    • Caffe
    • Caffe2
    • Chainer
    • Cognitive Toolkit
    • Matlab
    • PaddlePaddle
    • 。。。
  • 各种
    • cuDNN
    • TensorRT
      • 推理,小阶段产品
    • DeepStream SDK (2.0)
      • (音视频流)编解码期间,即可识别出你要的对象
    • cuBLAS
    • cuSPARSE
    • NCCL
都是基于CUDA
最新CUDA 9.2
Nvidia DIGITS
  • Interactive Deep Learning GPU Training System
直接用:
浏览器,去操作,远程深度学习的服务器的服务
包括各种管理和监控
还支持自定义
TensorRT:Work Flow
一般是处理4维的数据
比如:ncwh
  • n=number:多少张图片
  • c=channel:信道?
  • w=width:宽
  • h=height:高
支持:直接做推理
  • 可以不用TensorFlow,Caffe等
比如:
识别图片,至少需要做
  • praser:解析器
  • builder:引擎=可执行程序
https://developer.nvidia.com/tensorrt
  • 输入:训练好的模型
  • 输出:engine,可执行程序
演示:
(阿里云服务器,安装好了DIGITS)
tensorrt.cn:5000
问:此系统用于训练非图片,比如信号存到excel,是否支持?
答:要自己normalize后,变成图片这种才能支持。
问:生成对抗网络GAN是否支持?
答:支持。
问:PC机上的程序,如何移植到TS库上?
答:训练模型和网络参数,如果都设置好了,就可以了?

NVIDIA Tesla专业计算卡优势
陈晓翰? 吉浦迅 CEO?
  • 之前:4个月
  • TensorRT:1个月
  • DeepStream:半天
Tesla专业计算卡:
  • 简称:TS卡
    • TS1,TS2
  • 特点
    • 一般人:贵
    • 专业:
      • 专业元器件
      • 性能更好
      • 单精度
      • 双精度
        • ECC:准确度,持久度
下面介绍贵在什么地方:
  • GPU显卡本身性能:通常以 单精度 为基准
    • 高性能计算:双精度
    • 深度学习:半精度
  • 显存数量+带宽+传输模式:
    • 单GPU计算:CPU《-》GPU
    • 多GPU计算(包括集群):GPU《-》GPU
    • DMA引擎数量、支持GPU Direct技术、Hyper-Q
  • 计算模型限制
  • GeForce系列:
    • ECC校验:不支持
  • Tesla系列:(含TitanV)
    • ECC校验:支持
      • 确保数据正确与执行稳定
CUDA C Programming Guide
Programming Guide :: CUDA Toolkit Documentation

developer.nvidia-china.com
论坛 – NVIDIA 官方 Developer 论坛 – Powered by Discuz!
首页 – NVIDIA 官方 Developer 论坛 – Powered by Discuz!
机器学习 – GPU 加速的应用 |NVIDIA
Deep Learning Technology|NVIDIA

吉浦迅科技: GPU推广,Nvidia的合作伙伴

问题:
(1)NLP中如何实现深度学习实现从现有的普通的英文对话中学习,具有一定智能,实现自由对话?

吉浦迅科技
微信公众号:gpusolution
功能介绍:在这里,你可以及时了解NVIDIA GPU的行业资讯、最新进展、应用场景和各项功能。参与GPU世界举办的精彩活动,体验人工智能的未来生活。

【讲座通知】如何构建高效的深度学习开发环境
https://mp.weixin.qq.com/s/K3kJRGyY8vBH5H_qH4I1tw
深度学习已确认为进入AI殿堂的入口,对于要创建深度学习系统的企业和科研单位来说,如何快速入门、如何从GPU中获得最大计算收益等成为了他们考虑的因素。
NVIDIA作为人工智能领域技术领导厂商,诚挚邀请您参与6月26日于苏州工业园区西交利物浦大学的技术交流会,由NVIDIA中国区开发者社区经理等人,详细讲解企业或科研单位如何构建AI开发系统、如何搭建NVIDIA深度学习开发环境(TensorRT、cuDNN、DIGITS、CUDA等),以最大限度地提高数据科研人员的工作效率,除此之外,还将面对面交流实际应用时的经验分享。
日期:2018年6月26日
时间:下午13:30~16:30
地点:西交利物浦大学(江苏省苏州市工业园区仁爱路111号)北校区中心楼1106室
议程:
13:30 ~ 13:50报到
14:00 ~ 14:15 NVIDIA GPU应用市场总监侯宇涛
14:15 ~ 15:20 NVIDIA 开发者社区经理何  琨
15:20 ~ 15:30 休息时间
15:30 ~ 15:50 经验分享-NVIDIA Tesla专业计算卡优势
15:50 ~ 16:30QA时间

转载请注明:在路上 » 【讲座通知】如何构建高效的深度学习开发环境

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
85 queries in 0.112 seconds, using 20.66MB memory