课程主要内容 概述 企业计算 网格计算和云计算 P2P网络、CDN网络和物联网 社会计算 1986
课程主要内容 概述 企业计算 网格计算和云计算 P2P网络、CDN网络和物联网 社会计算
云计算 3典型的云计算产品 云计算的研究吸引了不同技术领域巨头,Amazon、Google、 1BM、微软和Yahoo等大公司是云计算的先行者。不同的产品对 云计算理论及实现架构也有所不同。 ◆ 云计算的先行者Google的云计算平台能实现大规模分布式计算和 应用服务程序,平台包括Hadoop框架、MapReduce?分布式处 理技术、分布式的文件系统GFS、结构化的Big Table?存储系统以 及Google2其他的云计算支撑要素。 ◆MapReduce:分布式处理技术、分布式的文件系统GFS、结构化 的Big Table存储系统是Googlef的三个核心技术。 /986
典型的云计算产品 云计算的研究吸引了不同技术领域巨头,Amazon、Google、 IBM、微软和Yahoo等大公司是云计算的先行者。不同的产品对 云计算理论及实现架构也有所不同。 云计算的先行者Google的云计算平台能实现大规模分布式计算和 应用服务程序,平台包括Hadoop框架、 MapReduce分布式处 理技术、分布式的文件系统GFS、结构化的BigTable存储系统以 及Google其他的云计算支撑要素。 MapReduce分布式处理技术、分布式的文件系统GFS、结构化 的BigTable存储系统是Google的三个核心技术。 云计算
云计算 3 MapReduce分布式处理技术 ◆MapReduce是Google2开发的ava、Python.、C++编程工具,用 于大规模数据集(大于1TB)的并行运算,也是云计算的核心技 术。 ◆MapReduce模式的思想是将要执行的问题拆解成Map(映射) 和Reduce(化简)的方式,先通过Map程序将数据切割成不相关 的区块,分配(调度)给大量计算机处理达到分布运算的效果, 再通过Reduce程序将结果汇整,输出开发者需要的结果。 /986
MapReduce分布式处理技术 MapReduce是Google开发的Java、Python、C++编程工具,用 于大规模数据集(大于1TB)的并行运算,也是云计算的核心技 术。 MapReduce模式的思想是将要执行的问题拆解成Map(映射) 和Reduce(化简)的方式,先通过Map程序将数据切割成不相关 的区块,分配(调度)给大量计算机处理达到分布运算的效果, 再通过Reduce程序将结果汇整,输出开发者需要的结果。 云计算
云计算 3 MapReduce的编程思想 分而治之 大数据计算任务 任务划分 子任务 子任务 子任务 子任务 结果合并 计算结课 1986
MapReduce的编程思想——分而治之 云计算 大数据计算任务 子任务 子任务 子任务 子任务 …… 任务划分 计算结果 结果合并
云计算 3 MapReduce可解决哪些算法问题 ◆MapReduce:待处理的数据集可以分解成许多小的数据集,而且每 一个小数据都可以完全并行地进行处理,因此不能解决不可分拆 的计算任务,或者相互间有依赖关系任务,如Fibonacci函数: Fk+2=Fk+Fk+1。 ◆MapReduce可解决的基本算法:各种全局数据相关性小、能适当 划分数据的计算任务。如:分布式排序、关系代数操作(选择, 投影,求交集、并集,连接,成组,聚合等)、矩阵向量相乘 矩阵相乘、词频统计(word count))、文档倒排索引等。 1986
MapReduce可解决哪些算法问题 MapReduce待处理的数据集可以分解成许多小的数据集,而且每 一个小数据都可以完全并行地进行处理,因此不能解决不可分拆 的计算任务,或者相互间有依赖关系任务,如Fibonacci函数: Fk+2 = Fk + Fk+1 。 MapReduce可解决的基本算法:各种全局数据相关性小、能适当 划分数据的计算任务。如:分布式排序、关系代数操作(选择, 投影,求交集、并集,连接,成组,聚合等)、矩阵向量相乘、 矩阵相乘、词频统计(word count)、文档倒排索引等。 云计算