当前位置：和泉文库 > 计算机 > 浏览文档

清华大学：A Heterogeneous Accelerator Platform for Multi-subject Voxel-based Brain Network Analysis（PPT讲稿）

Background and Motivation What is the brain network Platform and Algorithm Why and how we design accelerators Results Conclusion and future work What we can do next

文件格式：PPTX，文件大小：7.89MB，售价：10.58元

共47页，可试读17页，点击往前阅读 ↑↑

文档详细内容（约47页）

GPGPU Hardware Many-core SIMD model For massive data- parallel computation a High throughput 口 Low cost 200220082004 200620072008

GPGPU ➢ Hardware ❑ Many-core ❑ SIMD model ➢ For massive data-parallel computation ❑ High throughput ❑ Low cost 11

Outline Background and Motivation Platform and algorithms Results Conclusion and future work 12

Outline ➢ Background and Motivation ➢ Platform and Algorithms ➢ Results ➢ Conclusion and future work 12

Platform overview http://parabna.weebly.com Acquisition/BOLD Network Network Network Preprocessing Construction Further Analysis Research FunctionaImri Degree Correlation Distribution Matrix Clustering Calculation Coefficient Adjacency Time series Average& Matⅸ Binary GPU Efficiency GPU Modular Modular Structure Our focus GPU part 13

Platform Overview ➢ Our focus: ➢ GPU part: 13 http://parabna.weebly.com/ Functional MRI Time series

Network Construction 一一一奋 Temporal Pearson Correlation ∑(v2-)(vy-) (n-)2(1-)2 =(11,v12,…,i)r,=(1,2,…,N): BOLD signal IGembris 2010]: straight forward implementation >∑(v7-)(vy-) a Matrix Multiplication: R=VV, V=(v1v2,,UN) a One thread 16*16 numbers> data reuse in registers a 1400 Gflop/s on AMd 5870 a Computation is no longer the bottleneck(data transfer through PCIE is) 14

Network Construction ➢ Temporal Pearson Correlation 𝑟 Ƹ 𝑖,𝑗 = σ 𝒗𝒊 − 𝑣ҧ𝑖 𝒗𝒋 − 𝑣ҧ𝑗 σ 𝒗𝒊 − 𝑣ҧ𝑖 2 σ 𝒗𝒋 − 𝑣ҧ𝑗 2 ➢ 𝒗𝒊 = 𝑣𝑖1, 𝑣𝑖2, … , 𝑣𝑖𝐿 𝑇 , 𝑖 = (1, 2, … , 𝑁): BOLD signal 𝑖. ➢ [Gembris 2010]: straight forward implementation. ➢ σ 𝒗𝒊 − 𝑣ҧ𝑖 𝒗𝒋 − 𝑣ҧ𝑗 : ❑ Matrix Multiplication: 𝑹 = 𝑽 𝑇𝑽, 𝑽 = (𝒗𝟏 , 𝒗𝟐 , … ,𝒗𝑵) ❑ One thread 16*16 numbers → data reuse in registers ❑ 1400 Gflop/s on AMD 5870 ❑ Computation is no longer the bottleneck (data transfer through PCIE is) 14

Network Construction - scalability >R=VV. But R exceeds graphic memory Blocked matrix multiplication V=(V1,V2,,VD) R=vv (Ⅵ1V Vz 2V2 CPU time(s) GPU time(s) Speedup 2458 123x 15

Network Construction - scalability ➢ 𝑹 = 𝑽 𝑇𝑽. But 𝑹 exceeds graphic memory. ➢ Blocked matrix multiplication 𝑽 = (𝑉1 , 𝑉2 , … , 𝑉𝐷) 𝑅 = 𝑽 𝑻𝑽 = 𝑉1 𝑇 𝑉2 𝑇 ⋮ 𝑉𝐷 𝑇 𝑉1 𝑉2 ⋯ 𝑉𝐷 = 𝑉1 𝑇𝑉1 𝑉1 𝑇𝑉2 ⋯ 𝑉1 𝑇𝑉𝐷 𝑉2 𝑇𝑉1 𝑉2 𝑇𝑉2 ⋯ 𝑉2 𝑇𝑉𝐷 ⋮ ⋮ ⋱ ⋮ 𝑉𝐷 𝑇𝑉1 𝑉𝐷 𝑇𝑉2 ⋯ 𝑉𝐷 𝑇𝑉𝐷 15 CPU time (s) GPU time (s) Speedup 245.8 2.0 123x

点击进入文档下载页（PPTX格式）

共47页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

南京理工大学：《数据挖掘与处理 Data Mining and Data Processing》课程教学资源（PPT课件讲稿）第一章数据科学与数据挖掘（张正军）
香港浸会大学：《Data Communications and Networking》课程教学资源（PPT讲稿）Chapter 2 Protocol Architecture - TCP/IP model and OSI Model
《数据结构》课程教学资源（PPT课件讲稿）第十章文件、外部排序与外部搜索
《网站开发》课程教学资源（PPT课件讲稿）网站开发各阶段的任务
《C++大学教程》课程教学资源（PPT课件讲稿）Chapter 17 文件处理 File Processing
清华大学出版社：普通高校本科计算机专业特色教材精选《智能技术》课程教学资源（PPT讲稿课件）第4章模糊逻辑技术（曹承志）
《微机原理及应用》课程教学资源（PPT课件讲稿）第4章汇编语言程序设计
北京航空航天大学：《程序语言设计原理》课程教学资源（PPT课件讲稿）第三章过程式程序设计语言
北京航空航天大学：《程序语言设计原理》课程教学资源（PPT课件讲稿）并发程序设计语言
中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第6章 Data-Level Parallelism in Vector, SIMD, and GPU Architectures
山东大学：《微机原理及单片机接口技术》课程教学资源（PPT课件讲稿）第十一章复位、时钟和省电方式控制
计算机应用基础课程：《信息技术应用基础》教学资源（PPT课件讲稿）第一章中文WIN98操作系统
白城师范学院：《数据库系统概论 An Introduction to Database System》课程教学资源（PPT课件讲稿）第四章数据库安全性
合肥工业大学：《数据库系统》课程教学资源（PPT课件讲稿）数据库编程 ACCESS、MYSQL、Oracle（张国富）第一章绪论
《信息安全概论》课程教学资源（PPT课件讲稿）第九章计算机软件的安全性
清华大学：Pass-Join（A Partition based Method for Similarity Joins）
对外经济贸易大学：《电子商务概论》期末考试试卷（部分含答案）
沈阳理工大学：《大学计算机基础》课程教学资源（PPT课件讲稿）第3章办公软件 3.2 电子表格软件Excel 2010
深圳大学：Learning 3D mesh segmentation and labeling（PPT讲稿）
《电脑组装与维护实例教程》教学资源（PPT课件讲稿）第4章输入输出设备介绍及选购
北京科技大学：《物联网工程》课程教学资源（PPT课件讲稿）课程介绍
中国科学技术大学：《数据结构及其算法》课程PPT教学课件（Data Structure and Algorithm）第4章栈和队列（主讲：刘东）
清华大学：智能弹性重叠网关键技术研究（PPT讲稿，指导老师：李衍达）
《Access 2013数据库技术及应用》课程教学资源（PPT课件讲稿）第12章 VBA模块设计

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录