2019-01-14

作者: 098d0590ad3e | 来源:发表于2019-01-14 10:33 被阅读1次

TabLayout + 联动
瘦肉-ScalersTalk第四轮新概念朗读持续力训练Day35
晨读DAY 22 总结日志
2019-01-14
果的ScalersTalk第四轮新概念朗读持续力训练Day 99
2019-01-14
Mr. L 的ScalersTalk第四轮《新概念》朗读持续力训
荆的ScalersTalk第四轮新概念朗读持续力训练Day98
减肥日记 22
由炒菜所感

关于举办“GPU并行编程实践”高级实操班的培训通知

各有关单位：

随着人工智能AI、大数据Big Data、云计算Cloud Computing等计算机科学技术的发展和应用的普及，深度学习DL和人工智能AI成为当下最炙手可热的技术趋势，将成为技术行业基础设施的核心组成部分。GPU的价值不止体现在深度学习，在高性能计算、物联网、人工智能、生物信息、分子模拟、计算化学、材料力学、系统仿真、流体力学、机械设计、生物制药、航空动力、地质勘探、气候模拟等领域，算法越来越复杂，需要处理的海量数据越来越巨大，高性能计算能力就显得尤为重要。如今，乎所有的深度学习(机器学习)研究者都在使用GPU进行相关的研究，NVIDIA针对深度学习的计算，有一套完整的解决方案，cuDNN已经成为主流深度学习框架调用的深度学习GPU函数库，包含完整的矩阵乘法和卷积计算的实现。

GPU高性能计算已成为AI重要支撑技术，因此我单位举办“GPU并行编程实践培训班”,具体由北京中科云畅应用技术研究院举办，本次培训班由权威师资主讲。

一、培训目的：

现有硬件资源最大化利用，提供多种并行优化方案组合策略,提高并行程序设计与开发水平，熟悉常见的并行计算模式,了解深度学习的主流GPU加速解决方案；实际体验高性能计算环境，能够应对主流的超算环境；提供符合自身特点的工程计算解决方案，了解高性能计算和深度学习应用场景。

二、主讲专家：

刘老师中科院单位工程师，研究领域主要集中在高性能计算机系统结构、系统软件、高性能并行算法、高性能计算应用、可重构加速计算等几个方向。多年MPI/OpenMP/CUDA/OpenCL/OpenACC优化加速经验，有多个大型项目算法的HPC云计算并行优化加速经验。

三、时间地点：可咨询：13932327338 微信同号

扫码关注公众号，或加微信好友，邀请进群

2019年1月 21-22日（20日报道）北京中科院计算所龙芯产业园

四、培训费用：每人2500元（含报名费、培训费、资料费），食宿可统一安排，费用自理。

五、培训对象：

从事高性能计算、GPU加速、并行计算、CUDA编程、openCV、石油、气象、化工、人工智能、深度学习、计算机视觉、人脸识别、图像处理、行人检测、自然语言处理等领域相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关技术人员；

六、培训内容：

GPU高性能计算——OpenACC编程基础与优化进阶并行计算的应用场景和实际意义

并行计算机体系结构：处理器、内存和互连网，常用的并行计算机系统

性能分析模型：如何测量并行性能和扩展性

CPU/GPU体系结构对比介绍：流水线、多核、缓存、访存、通信模型、分支预测等

OpenACC基础：概念，与CUDA区别，编译器，生态

OpenACC四步开发流程：判断并行性，并行化表达，显式数据传递，优化

判断并行性：Profile工具pgprof

并行化表达：引导关键字Kernerls和Parallel Loop

显式管理数据的拷贝：引导关键字Data

OpenACC上机实战：矢量点乘

OpenACC优化：统一内存管理，线程并行层级，collapse，tile

GPU高性能计算——CUDA编程基础与优化进阶 CUDA基础：API、数据并行、线程模型、存储模型、控制、同步、并发和通信、加速比

CUDA开发环境搭建和工具配置

CUDA上机：Helloworld，向量加

CUDA优化进阶：线程组织调度，分支语句，访存优化，数据传输，原子操作

CUDA上机：矩阵乘、直方图

GPU并行计算模式及案例分析

分析调试：parallel nsight，visual profiler，cuda-gdb

CUDA上机实战：卷积，reduce和scan

GPU异步编程，多GPU编程（混合OpenMP和MPI）及调试调优工具

OpenACC互操作性：OpenMP，MPI，CUDA

NVIDIA最新技术：CUDA 10新特性，Turing显卡

GPU高性能计算——深度学习 1.1基于GPU的交互式深度学习训练平台：DIGITS；

1.2深度学习框架的GPU加速：TensorFlow，Caffe等；

1.3 NVIDIA深度学习SDK：cuDNN，TensorRT，NCCL；

1.4深度学习显卡选择；

深度学习上机实操：

Caffe，TensorFlow，Theano等通用深度学习框架的GPU加速库cuDNN的使用；

深度学习前端推理引擎TensorRT的使用；

七、颁发证书：

学员经培训考试合格后可以获得：由北京中科云畅应用技术研究院颁发的结业证书。

备注：请学员自带身份证复印件一张（办理证书使用）

网友评论

程序员

本文标题：2019-01-14

本文链接：https://www.haomeiwen.com/subject/aghddqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2019-01-14

相关文章

TabLayout + 联动

瘦肉-ScalersTalk第四轮新概念朗读持续力训练Day35

晨读DAY 22 总结日志

2019-01-14

果的ScalersTalk第四轮新概念朗读持续力训练Day 99

2019-01-14

Mr. L 的ScalersTalk第四轮《新概念》朗读持续力训

荆的ScalersTalk第四轮新概念朗读持续力训练Day98

减肥日记 22

由炒菜所感

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

程序员