当前位置：和泉文库 > 计算机 > 浏览文档

《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 12 Shared Memory Multiprocessor

文件格式：PDF，文件大小：1.42MB，售价：9.12元

文档详细内容（约40页）

高级计算机体系结构设计及其在数据中心和云计算的应用Lecture 12Shared-Memory Multi-Processors

高级计算机体系结构设计及其在数据中心和云计算的应用 Lecture 12 Shared-Memory Multi-Processors

高级计算机体系结构设计及其在数据中心和云计算的应用Shared-Memory MultiprocessorsMultiple threads use shared memory (address space)-"SysV Shared Memory" or“"Threads" in softwareCommunication implicitvialoadsandstores- Opposite of explicit message-passing multiprocessorsTheoretical foundation:PRAM modelPAP2Q3P4MemorySystem

高级计算机体系结构设计及其在数据中心和云计算的应用 Shared-Memory Multiprocessors • Multiple threads use shared memory (address space) – “SysV Shared Memory” or “Threads” in software • Communication implicit via loads and stores – Opposite of explicit message-passing multiprocessors • Theoretical foundation: PRAM model P1 P2 P3 P4 Memory System

高级计算机体系结构设计及其在数据中心和云计算的应用Why Shared Memory?Pluses-App seesmultitaskinguniprocessor- os needs only evolutionaryextensions-CommunicationhappenswithoutOs.Minuses-Synchronizationis complex- Communication is implicit (hard to optimize)- Hard to implement (in hardware)Result-SMPsandCMPsaremostsuccessfulmachinestodate-First withmulti-billion-dollarmarkets

高级计算机体系结构设计及其在数据中心和云计算的应用 Why Shared Memory? • Pluses – App sees multitasking uniprocessor – OS needs only evolutionary extensions – Communication happens without OS • Minuses – Synchronization is complex – Communication is implicit (hard to optimize) – Hard to implement (in hardware) • Result – SMPs and CMPs are most successful machines to date – First with multi-billion-dollar markets

高级计算机体系结构设计及其在数据中心和云计算的应用Paired vs. Separate Processor/Memory?Separate CPU/memory· Paired CPU/memory-Uniformmemoryaccess-Non-uniformmemoryaccess(UMA)(NUMA)Equallatencytomemory.Fasterlocalmemory.Data placement matters-Lowpeakperformance- High peak performance[CPU($)CPU(S)CPU(S)CPU(S)CPU(S)CPU($)CPU(S)CPU($)RMemMemRMemRMemRMemMemMemMem

高级计算机体系结构设计及其在数据中心和云计算的应用 Paired vs. Separate Processor/Memory? • Separate CPU/memory – Uniform memory access (UMA) • Equal latency to memory – Low peak performance • Paired CPU/memory – Non-uniform memory access (NUMA) • Faster local memory – Low peak performance • Data placement matters – High peak performance CPU($) Mem CPU($) Mem CPU($) Mem CPU($) Mem CPU($) Mem CPU($) Mem CPU($) Mem CPU($) R R R Mem R

高级计算机体系结构设计及其在数据中心和云计算的应用Shared vs. Point-to-Point Networks· Shared networkPoint-to-point network:- Example:bus-Example:mesh,ring-Low latency-Highlatency (many“hops")-Lowbandwidth-Higherbandwidth.Doesn't scale >~16 cores: Scales to 1000s of cores-Simplecachecoherence-ComplexcachecoherenceCPU($)CPU(S)CPU($)CPU(S)CPU($)CPU($)MemRMemRMemRMemRRMemMemRMemRRMemCPU(S)CPU(S)

高级计算机体系结构设计及其在数据中心和云计算的应用 Shared vs. Point-to-Point Networks • Shared network – Example: bus – Low latency – Low bandwidth • Point-to-point network: – Example: mesh, ring – High latency (many “hops”) – Higher bandwidth • Doesn’t scale >~16 cores – Simple cache coherence • Scales to 1000s of cores – Complex cache coherence CPU($) Mem CPU($) Mem R CPU($) Mem R CPU($) R Mem CPU($) R Mem CPU($) Mem CPU($) Mem CPU($) R R R Mem R

点击进入文档下载页（PDF格式）

共40页，可试读14页，点击继续阅读 ↓↓

您可能感兴趣的文档

《现代计算机体系结构》课程教学课件（留学生版）Lecture 1 Instruction Set Architecture（Introduction）
《现代计算机体系结构》课程教学课件（留学生版）Lecture 0 Introduction and Performance Evaluation
《现代计算机体系结构》课程教学课件（留学生版）Lecture 3 Pipelining
《现代计算机体系结构》课程教学课件（留学生版）Lecture 2 Instruction Set Architecture（Microarchitecture Implementation）
《现代计算机体系结构》课程教学课件（留学生版）Lecture 7 Multiprocessors
《现代计算机体系结构》课程教学课件（留学生版）Lecture 4 Spectualtive Execution
《现代计算机体系结构》课程教学课件（留学生版）Lecture 6 Memory Hierarchy and Cache
《现代计算机体系结构》课程教学课件（留学生版）Lecture 5 Out of Order Execution
武汉理工大学：《模式识别》课程教学资源（PPT课件）第4章基于统计决策的概率分类法
武汉理工大学：《模式识别》课程教学资源（PPT课件）第1章绪论、第2章聚类分析
武汉理工大学：《模式识别》课程教学资源（PPT课件）第3章判别函数及几何分类法
武汉理工大学：《模式识别》课程教学资源（PPT课件）第7章模糊模式识别法
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 15 GPGPU Architecture and Programming Paradigm
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 14 Towards Renewable Energy Powered Sustainable and Green Cloud Datacenters
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 11 Multi-core and Multi-threading
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 10 Out of Order and Speculative Execution
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 13 An Introduction to Cloud Data Centers
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 09 Case Study- Jave Branch Prediction Optimization
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 07 Instruction Decode
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 08 Instruction Fetch and Branch Predictioin
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 06 Scoreboarding and Tomasulo
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 04 Memory Data Prefetching
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 05 Core Pipelining
《现代计算机体系结构》课程教学课件（英文讲稿）Lecture 02 Memory Hierarchy and Caches

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录