×

编程之美's video: CUDA 06-4: 3

@CUDA 编程入门 06-4: 并行规约算法 (3) 改进共享内存访问 消除冲突
完整高级课程: "GPU 计算: CUDA 编程从入门到精通", 请访问: https://www.udemy.com/course/cuda-yxp/?couponCode=064748E49AF03019A837 代码 repo: https://github.com/huiscliu/Tutorials GPU 计算是指同时利用图形处理器 (GPU) 和 CPU,加快科学、分析、工程、消费和企业应用程序的运行速度。课程完整目录: 1-0-什么是 GPU 计算 1-1-GPU 架构综述 1-1-处理器空间 1-1-内存空间 1-2-计算能力 1-3-如何编写 CUDA 程序 1-4-如何编译 CUDA 程序 1-5-CUDA 函数修饰符 1-6-内存修饰符 1-7-内建向量 1-8-内建变量 2-0-CUDA 编程模型 2-1-硬件映射 2-2-向量加法示例 2-3-主机函数: __host__ 2-4-设备函数: __device__ 2-5-核函数: __global__ 2-6-网格 2-7-线程块 2-8-网格维度: gridDim 2-9-线程块维度: blockDim 2-10-线程块 ID: blockIdx 2-11-线程 ID: threadIdx 2-12-线程调度 2-13-线程块与线程编号映射 2-14-向量加法示例 2-15-如何启动核函数 2-16-线程执行顺序 3-0-GPU 内存 3-1-CPU 内存 3-2-页锁定内存 4-0-GPU 内存管理综述 4-1-CPU 内存管理综述 4-2-页锁定内存 4-3-1-全局内存 4-3-2-全局内存示例 4-4-1-共享内存 4-4-2-共享内存 bank 冲突 4-4-3-共享内存规约算法 4-5-1-内存拷贝 4-5-2-示例 4-6-向量操作 4-7-稀疏矩阵向量乘法 4-8-地址空间 5-0-同步 5-1-核函数同步 5-2-线程块同步 5-3-Warp 同步 5-4-Warp 同步深入理解 6-1-什么是规约算法- 如何并行 6-2-并行规约算法-1: 二叉树算法 6-3-并行规约算法-2: 改进 warp divergence 6-4-并行规约算法-3: 改进共享内存访问 6-5-并行规约算法-4: 改进全局内存访问 6-6-并行规约算法-5: warp 内循环展开 6-7-并行规约算法-6: 完全循环展开 6-8-并行规约算法:成功优化的关键 6-9-完整并行规约算法:三阶段算法与完整代码 6-10-并行规约算法应用: 内积 7-0-线程调度概述 7-1-Warp 投票函数 7-2-Warp 匹配函数 7-3-Warp 规约函数 7-4-Warp 内通信: 数据交换 8-1-Cooperative Groups 8-2-隐式组类型 8-3-显式组类型 8-4-Coalesced Groups 8-5-组划分 8-6-Group Labeled Partition 8-7-Group Binary Partition 8-8-组同步 8-9-网格同步 9-1-CUDA 程序概述 9-2-CUDA 程序优化: 探索并行化 9-3-CUDA 程序优化: GPU 内存优化策略 9-4-CUDA 程序优化: 指令优化

2

8
编程之美
Subscribers
16.4K
Total Post
87
Total Views
7K
Avg. Views
140.3
View Profile
This video was published on 2019-05-07 03:00:00 GMT by @%e7%bc%96%e7%a8%8b%e4%b9%8b%e7%be%8e on Youtube. 编程之美 has total 16.4K subscribers on Youtube and has a total of 87 video.This video has received 2 Likes which are higher than the average likes that 编程之美 gets . @%e7%bc%96%e7%a8%8b%e4%b9%8b%e7%be%8e receives an average views of 140.3 per video on Youtube.This video has received 8 comments which are higher than the average comments that 编程之美 gets . Overall the views for this video was lower than the average for the profile.

Other post by @%e7%bc%96%e7%a8%8b%e4%b9%8b%e7%be%8e