当前位置：和泉文库 > 计算机 > 浏览文档

上海交通大学：《Multicore Architecture and Parallel Computing》课程教学资源（PPT课件讲稿）Lecture 7 CUDA

文件格式：PPT，文件大小：3.5MB，售价：10.5元

文档详细内容（约50页）

Matrix Layout 0 N 02。0|13.0 21132 MOOM1OM2OM M3.1 Mo2 M12 M2.2 M3

Matrix Layout 11

Matrix Main Program int main(void)i 1.//Allocate and initialize the matrices m. n, p //1/0 to read the input matrices m and N 2.//M*Non the device MatrixMultiplication(M,N, P, Width): 3. //I/0 to write the output matrix // Free matrices M. N, p return o

Matrix Main Program 12

S)Kernel Program void MatrixMultiplication(float*M, float*N, float*P, int Width) int size-Width Width sizeof(float) float* Md, Nd, pd 1.// Allocate device memory for M, N, and p / copy M and N to al located device memory locations 2.// Kernel invocation code- to have the device to perform / the actual matrix multiplication 3.// copy P from the device memory / Free device matrices

Kernel Program 13

O Creating CUDA Memory Space TILE WIDTH 64 Float* Md int size TILE WIDTH* TILE WIDTH sizeof(float) cudaMalloc((void*x)&Md, size) cudaFree(Md;

Creating CUDA Memory Space 14

O Memory Copy (Device) Grid cudaMemcpyo Memory data transfer Block(0, 0) Block(1, 0) Requires four parameters Pointer to destination Shared Memory Shared Memory Pointer to source Number of bytes copied RegistersRegiste Type of transfer Thread(0, O) Thread (1, 0)Thread (0, o) Thread (1, o) Host to Host Host to Device Device to Host Device to device Transfer is asynchronous cudaMemcpy (Md, M, size, cudaMemcpyHostTo Device); cudaMemcpy (M, Md, size, cudaMemcpy DeviceToHost);

Memory Copy 15

点击进入文档下载页（PPT格式）

共50页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

上海交通大学：云安全（PPT讲稿）Cloud Security
局域网的硬件设备和操作系统（PPT讲稿）
大数据分析（PPT讲稿）大数据引领我们走向数据智能化时代
淮阴工学院：《数据库原理》课程教学资源（PPT课件讲稿）第3章关系数据库的基本理论
《Java面向对象程序设计》课程教学资源（PPT课件讲稿）第三章 Java面向对象编程
《Java面向对象程序设计》课程教学资源（PPT课件讲稿）第六章 Java输入输出流与文件操作
《Java面向对象程序设计》课程教学课件（PPT讲稿）流程控制语句
《Java面向对象程序设计》课程教学课件（PPT讲稿）AWT和Swing组件
江苏海洋大学（淮海工学院）：《Java面向对象程序设计》课程教学资源（PPT课件讲稿）第4章 Java图形用户界面设计
江苏海洋大学（淮海工学院）：《Java面向对象程序设计》课程教学资源（PPT课件讲稿）第2章 Java语言基础
《Java面向对象程序设计》课程教学资源（PPT课件讲稿）第四章 Java图形用户界面设计 4.2 AWT和Swing组件
《高级语言程序设计 Advanced Programming》课程教学资源（PPT课件讲稿）第8章指针
上海交通大学：《通信网络》课程PPT教学课件（讲稿）Communication Networks - ANALYSIS OF 10G EEE PROTOCOL
亚马逊云计算AWS（Amazon Web Service）、Cloud Computing——Cassandra
《计算机图形学》课程教学资源（PPT课件讲稿）Chapter 4 Graphics Output Primitives（Part II）
北京理工大学：《软件工程基础》课程教学资源（PPT课件讲稿）需求工程（主讲：刘驰）
上海交通大学：Scheduling Algorithms in Heterogeneous Computing Systems
上海交通大学：《程序设计》课程教学资源（PPT课件讲稿）第5章批量数据处理——数组
上海交通大学：《现代操作系统》课程教学资源（PPT课件讲稿）Chapter 02 进程与线程 Process and Thread
《数据库基础与应用》课程PPT教学课件（Access案例教程）第9章数据库语言SQL
《数据库基础与应用》课程PPT教学课件（Access案例教程）第8章宏
《数据库基础与Access应用》课程教学资源（PPT课件）第12章应用实例
《数字图像处理基础》课程教学资源（教学大纲
长安大学：《微机原理》课程教学资源（PPT课件讲稿）第7章汇编语言程序设计

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录