极速pk10

大会介绍

MATLAB GPU并行编程研讨会





·培训简介

20世纪70年代Cleve Moler开发MATLAB开始, MATLAB受到学术界和工业界的欢迎,用户超过200万。然而,很多算法的MATLAB实现代码都有加速的需求。以深度学习为例,相关的MATLAB代码需要运行数小时甚至数天的时间。GPU计算和CUDA编程为MATLAB加速提供了很好的解决方案。

越来越多的企业开始使用相关的技术,企业对于MATLAB加速的岗位需求越来越多,对于MATLAB的高质量的人才需求更加的迫在眉睫,此次培训,就是要以给相关从业人员以及爱好者普及MATLAB的基础,建立MATLAB的优化方向,帮助从业人员以及爱好者更好,更稳的入门,降低学习时间于学习盲区。


·时间地点


2019/08/29 - 2019/09/01

极速pk10有疑问可联系:13001051273或798947682@qq.com


·培训内容

内容

概述




第1章绪论

基于不同硬件的MATLAB程序加速




第2章MATLAB程序的性能评估

bench()、tic()、toc()、timeit()、cputime()、clock()、etime()、gputimeit()等相关函数




第3章基于多核处理器的MATLAB程序加速

MATLAB矩阵、运算符、操作、定义、以及分支和循环结构




第4章基于大内存的MATLAB程序的加速

内存预分配




MATLAB向量化简介




MATLAB矩阵运算的向量化




数据复制




MATLAB的矩阵变换




基于arrayfun()、bsxfun()、cellfun()、spfun()、structfun()、pagefun()函数的向量化




第5章基于并行计算工具箱的MATLAB加速

设备端(GPU端)的随机数矩阵、稀疏矩阵、数据类型、检验、操作、定义、执行




大内存的MATLAB程序的加速




卷积神经网络前向传播的激活函数、降采样层、升采样层、卷积层、梯度计算




第6章MATLAB与C/C++的接口

MEX库API、MEX相关的函数、mexGet()函数




MEX库API与输入输出相关的函数




定义MEX函数的数据类型




数据类型校验、数据存取、数据类型转换




第7章基于CUDA库的MATLAB加速

ArrayFire函数




CUDA的混合编程




第8章GPU计算简介

GPU计算加速的度量、加速比




阿姆达尔定律和古斯塔夫森定律




张量、类脑、视觉、物理、图形处理器




计算单元、GPU内存




GPU当前状态的检测




GPU集群设置




第9章CUDA编程简介

CUDA核、CUDA线程、线程块




全局内存、共享内存、锁页内存、纹理内存和表面内存




CUDA流于CUDA流的创建和结束




显式同步、隐式同步




多设备系统的初始化、设备计数、设备选择、CUDA流和CUDA事件




动态并行的编程模型、环境配置、内存管理、嵌套深度




统一内存编程的优点




统一内存分配、并行性、检验、性能优化




序列蒙特卡罗的类别分布随机数、哈尔变换




第10章CUDA程序优化

CUDA程序优化的策略、指令吞吐、控制、同步




线程和线程块级别的优化、CUDA级别的优化,程序级别的优化




warp相关部分




第11章基于CUDA的MATLAB加速

基于CUDAKernel、MEX的MATLAB加速




第12章总结

进一步了解MATLAB加速





·培训教材

《加速MATLAB编程指南 CUDA实现》

MATLAB是广泛应用的算法开发语言之一。然而,MATLAB简单易用的特性与算法复杂性的矛盾,造成了各个领域的MATLAB程序运行缓慢。本书总结了作者多年来在算法开发工作中关于MATLAB程序加速的实战经验,系统地介绍了利用GPU计算能力和CUDA编程语言实现加速MATLAB编程的方法。

本书首先介绍了MATLAB程序的性能评估的方法,帮助读者找到制约MATLAB程序运行速度的瓶颈所在; 接着循序渐进地介绍加速MATLAB编程的方法,包括基于多核处理器的MATLAB程序加速、基于大内存和向量化的MATLAB程序加速、基于并行计算工具箱和GPU计算的MATLAB加速、基于CUDA库的MATLAB加速、基于CUDA语言的MATLAB加速等。同时,本书附带了大量程序实例,包括深度学习及大数据分析领域的例子,深入浅出地示范各种基于CUDA语言的MATLAB程序加速的技巧。

本书可帮助读者对所在领域的MATLAB应用程序进行显著加速,大幅提升算法开发的效率。


·培训对象

高等院校教学与课题研究难以开展的教师,实战水平欠缺的专业方向学生,各地企业单位、科研院所的计算技术开发人员,对人工智能/高性能计算/云计算感兴趣或注重学习和深造的相关人员。从事高性能计算、GPU加速、并行计算、CUDA编程、OpenCV、石油、气象、化工、人工智能、深度学习、计算机视觉、人脸识别、图像处理、行人检测、自然语言处理等领域相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关技术人员。


·主讲教师

刘老师

中国科学院系统,主要研究领域为高性能计算、并行编程、生物医学图像处理,拥有多年MPI/OpenMP/CUDA/OpenCL/OpenACC优化加速经验与大型项目移植优化经验。

谢老师

中科院计算所高性能中心工程师,长期从事并行优化工作,有流体力学,医学图像处理等多个方向的优化经验


·培训费用

5000元,前10天报名3980,学生价格3000


发票内容:会议费,技术培训费,技术服务费


·实验平台

自带笔记本上机,所需实验材料将提前通知


更多资讯欢迎关注微信公众号:中科图云


颁发证书:

工业和信息化部颁发的证书。该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

注:                                                   

证书需另外收费,700/人。

请学员带一寸彩照2张(背面注明姓名)、身份证复印件一张。





时间:08-29 09:00 - 09-01 17:00
极速pk10 地点:地铁永丰站中关村壹号具体会议室会前通知

报名购票

主办方