当前位置：和泉文库 > 计算机 > 浏览文档

上海交通大学：《Multicore Architecture and Parallel Computing》课程教学资源（PPT课件讲稿）Lecture 9 MapReduce

文件格式：PPTX，文件大小：2.6MB，售价：11.62元

文档详细内容（约56页）

O Distributed Grep Split datal→→grep matches Very sp| t data→grep matches big-sp| t data→grep→ matches→cat→A∥ matches data Split data-+ grep matches

Distributed Grep 6 Very big data Split data Split data Split data Split data grep grep grep grep matches matches matches matches cat All matches

②Map+ Reduce Very MAP Partitioning big REDUcE Result Function data Map Reduce Accepts input key / value Accepts intermediate pair ★ ey/value pair -Emits intermediate Emits output key/value Rey value pair

Map+Reduce 7 • Map – Accepts input key/value pair – Emits intermediate key/value pair • Reduce – Accepts intermediate key/value* pair – Emits output key/value pair Very big data Result M A P R E D U C E Partitioning Function

②Map+ Reduce map(key val) is run on each item in set emits new-Rey/ new-val pairs reduce(key, vals) is run for each unique key emitted by mapo emits final output

8 • map(key, val) is run on each item in set – emits new-key / new-val pairs • reduce(key, vals) is run for each unique key emitted by map() – emits final output Map+Reduce

G)Square Sum (map f list lista listg'Unary operator ( map square“(1234) -14916 o reduce (14916) 30

Square Sum 9 • (map f list [list2 list3 …]) • (map square ‘(1 2 3 4)) – (1 4 9 16) • (reduce + ‘(1 4 9 16)) – (+ 16 (+ 9 (+ 4 1) ) ) – 30

G)Word Count Input consists of(url, contents) pairs map key=url, val=contents) For each word w in contents,emit(W,“1”) reduce key-word, values=unig- counts Sum all“1” s in values list Emit result "(word, sum

Word Count 10 – Input consists of (url, contents) pairs – map(key=url, val=contents): • For each word w in contents, emit (w, “1”) – reduce(key=word, values=uniq_counts): • Sum all “1”s in values list • Emit result “(word, sum)

点击进入文档下载页（PPTX格式）

共56页，可试读19页，点击继续阅读 ↓↓

您可能感兴趣的文档

河南中医药大学（河南中医学院）：《计算机网络》课程教学资源（PPT课件讲稿）第三章数据链路层
《多媒体教学软件设计》课程教学资源（PPT课件讲稿）第4章多媒体教学软件的图文演示设计
四川大学：《计算机操作系统 Operating System Principles》课程教学资源（PPT课件讲稿）第9章文件管理
南京航空航天大学：《数据结构》课程教学资源（PPT课件讲稿）第十章排序
西安电子科技大学：《信息系统安全》课程教学资源（PPT课件讲稿）第二章安全控制原理
《C程序设计》课程电子教案（PPT课件讲稿）第四章数组和结构
北京航空航天大学：Graph Search & Social Networks
《数字图像处理 Digital Image Processing》课程教学资源（各章要求及必做题参考答案）
Online Minimum Matching in Real-Time Spatial Data：Experiments and Analysis
中国科学技术大学：《并行算法实践》课程教学资源（PPT课件讲稿）上篇并行程序设计导论单元II 并行程序编程指南第七章 OpenMP编程指南
上海交通大学：《网络安全技术》课程教学资源（PPT课件讲稿）比特币（主讲：刘振）
电子工业出版社：《计算机网络》课程教学资源（第五版，PPT课件讲稿）第三章数据链路层
西安交通大学：《网络与信息安全》课程PPT教学课件（网络入侵与防范）第四章口令破解与防御技术
《机器学习》课程教学资源（PPT课件讲稿）第十二章计算学习理论 Machine Learning
广西外国语学院：《计算机网络》课程教学资源（PPT课件讲稿）第9章 DHCP协议（任课教师：卢豫开）
《信息技术基础》课程教学资源（PPT课件）信息技术基础知识的内容
《PHP程序设计》教学资源（PPT课件讲稿）项目二网站用户中心
Microsoft .NET（PPT课件讲稿）Being Objects and A Glimpse into Coding
《Data Warehousing & Data Mining》课程教学资源（PPT讲稿）Ch 2 Discovering Association Rules
《软件工程》课程教学资源（PPT课件讲稿）需求分析
西安电子科技大学：《微机原理与接口技术》课程教学资源（PPT课件讲稿）第八章中断系统与可编程中断控制器8259A
《ARM原理与设计》课程教学资源（PPT课件讲稿）Lecture 04 Cortex M3指令集
电子工业出版社：《计算机网络》课程教学资源（第五版，PPT课件讲稿）第一章概述
上海交通大学：《计算机控制技术》课程教学资源（PPT课件）第一章计算机控制系统概述 Computer Control Technology

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录